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作为 UNIX 环 境 编程 方面 的 经 典 著 作 ， 由 著名 技术 专家 W. Richard 
Stevens #5 fJ Advanced Programming in the UNIX ® Environment 目 1992 
年 出 版 以 来 ， 受 到 专家 和 读者 的 普 衣 欢迎。 由 Stephen A. Rago 作为 共同 
作者 ， 根 据 新 的 系统 和 规范 进行 了 更 新 ，2005 年 出 版 了 第 2 版 。2013 年 
由 Rago 更 新 到 了 第 3 版 ， 涵 盖 了 70 多 个 最 新 版 POSIX.1 标 准 的 新 增 接 
口 ， 删 除了 STREAMS 相 关 接 口 的 内 容 ， 并 将 使 用 的 典型 平台 更 新 为 
Solaris 10、Darwin 10.8.0. FressBSD 8.0 和 Ubuntu 12.04. 

目前 UNIX 版 本 不 断 涌现 ， 例 如 广 为 使 用 的 苹果 Mac OS X 和 iOS 使 
用 开源 类 UNIX 操 作 系 统 Darwin， 谷 歌 的 Android 采 用 Linux 作 为 操作 系 
统 内 核 。 尺 管 UNIX 编 程 环 境 和 C 程 序 设计 语言 的 标准 化 方面 已 经 有 不 少 
工作 ， 但 系统 接口 不 断 增 加 ， 例 如 Single UNIX Specification 第 1 版 
(SUSv1) 1994 年 出 版 时 大 约 包含 了 1170 个 接口 〈 也 被 称 为 Spec 
1170) ， 到 2010 年 发 布 第 4 版 时 (SUSv4) ， 已 经 包括 1833 个 接口 。 虽 
然 系 统 调用 接口 和 库 函 数 可 参见 《UNIX 程 序 员 手 册 》 第 2、3 部 分 ， 
但 “手册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 正 是 本 书 所 要 讲述 的 内 
容 ”《〈 第 1 版 前 言 ) 。 本 书 精 选 了 利用 的 400 多 个 系统 调用 和 库 函 数 ， 这 
些 接口 基本 是 UNIX 系 统 软 件 的 核心 功能 ， 涵 盖 了 UNIX/Linux 系统 编程 
的 方方面面 。 本 书 通过 简明 完整 的 例子 来 说 明 其 用 途 ， 不 仅仅 说 明了 其 
基本 用 法 ， 还 反映 了 不 同 平台 之 间 细 微 差 异 ， 有 助 于 读者 对 整个 编程 环 
境 有 全 面 深 入 的 了 解 。 在 翻译 本 书 的 过 程 中 ， 译 者 也 是 收益 民 多 ， 同 
时 ， 一 些 经 典 的 案例 已 经 用 于 大 学 课堂 教学 和 编程 实践 中 。 

本 书 的 第 2 HOA 12 章 由 同济 大 学 张 亚 英 翻译 和 校对 ， 其 余 由 上 
海 交 通 大 学 软件 学 院 威 正 伟 翻译 和 校对 ， 上 海 交 通 大 学 计算 机 系 尤 普 元 
教授 对 全 书 统 稿 。 本 书 第 1 版 和 第 2 版 中 译本 目 出 版 以 来 ， 很 多 读者 对 其 
提出 了 宝贵 意见 ， 在 本 版 本 中 尽量 采纳 了 这 些 意 见 。 同 时 ， 我 们 的 工作 
还 得 到 上 海 交 通 大 学 软件 学 院 许多 研究 生 ERE, TEER, FE E 
润泽 、 朱 新 宇 、 孙 海洋 、 张 子 齐 、 许 欣 吴 、 马 苗 、 染 丹 ) 的 帮助 ， 在 此 
一 并 表示 感谢 。 

还 要 特别 感谢 人 民 邮 电 出 版 社 编辑 杨 海 玲 在 本 书 的 编辑 、 出 版 方面 
所 付出 的 辛勤 劳动 。 

我 们 希望 本 书 的 出 版 对 相关 科技 人 员 和 读者 所 有 帮助 ， 同 时 也 期 望 
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我 差不多 每 次 在 接受 专访 当中 ， 或 是 做 技术 讲座 后 的 提问 时 间 里 ， 
总 会 被 问 及 这 样 一 个 问题 : “你 想到 过 UNIX 会 生存 这 么 长 时 间 吗 ? ” 自 
然 ， 每 次 的 回答 都 是 : “没有 ， 我 们 没 想到 会 是 这 样 。” 从 某 种 角度 说 ， 
e 
新 闻 了 。 

发 展 的 历程 错综复杂 ， 充 满 变数 。 自 20 世 纪 70 年 代 初 以 来 ， 计 算 机 
技术 经 历 了 沧海 桑田 般 的 变化 ， 尤 其 体现 在 网 络 技术 的 普遍 应 用 、 图 形 
化 的 无 所 不 在 、 个 人 计算 的 触手 可 及 ， 然 而 UNIX 系 统 却 奇迹 般 地 容纳 
和 适应 了 所 有 这 些 变化 。 虽 然 商 业 应 用 环境 在 桌面 领域 目前 仍然 为 微软 
和 英特尔 两 家 公司 所 统治 ， 但 是 在 某 些 方面 已 经 从 单一 供应 商 向 多 种 来 
源 转 变 ， 特 别 是 近年 来 对 公共 标准 和 免费 可 用 来 源 的 信赖 与 日 俱 增 。 

UNIX 作为 一 种 现象 而 不 单 是 商标 品牌 ， 有 可 能 与 时 俱 进 ， 乃 至 领 
导 潮 流 。 在 20 世纪 70 一 80 年 代 ，AT&T 虽 对 UNIX 的 实际 源 代 码 进 行 了 
版 权 保护 ， 但 却 鼓励 在 系统 的 接口 和 语言 基础 上 进行 标准 化 的 工作 。 例 
如 ，AT&T 发 布 了 SVID (System V Interface Definition， 系统 V 接 口 定 
X) ， 这 成 为 POSIX 及 其 后 续 工 作 的 基础 。 后 来 ，UNIX 可 以 说 相当 优 
雅 地 适应 了 网 络 环境 ， 虽 不 那么 轻巧 却 也 充分 地 适应 了 图 形 环 境 。 再 往 
后 ， 开 源 运 动 的 技术 基础 中 集成 了 UNIX 的 基本 内 核 接 口 和 许多 它 独 特 
的 用 户 级 工具 。 

即使 在 UNIX 软 件 系 统 本 身 还 是 专 有 的 时 候 ， 鼓 励 出 版 UINIX 系 统 方 
面 的 论文 和 书籍 也 是 至 关 重 要 的 ， 著 名 的 例子 就 是 Maurice Bach 的 
《UNIX 操 作 系 统 设计 》 一 书 。 其 实 我 要 说 明 的 是 ， ”UNIX 长 寿 的 主要 
原因 是 ， 它 吸引 了 极 具 天 分 的 技术 作者 ， 为 大 众 解读 它 的 优美 和 神秘 所 
在 。Brian Kernighan 是 其 中 之 一 ，Rich Stevens 自 然 也 是 。 本 书 第 1 版 连 
同 Stevens 所 著 的 系列 网 络 技 术 书 籍 ， 被 公认 为 优秀 的 、 匠 心 独 具 的 名 
著 ， 成 为 极其 畅销 的 作品 。 

然而 ， 本 书 第 1 版 毕竟 出 版 时 间 太 早 了 ， 那 时 还 没有 出 现 Linux， 源 
HIHA] CSRG 的 UNIX 接 口 的 开源 版 本 还 没有 广 为 流行 ， 很 多 人 的 网 
络 还 在 用 串 行 调制 解 调 器 。Steve Rago 认 真 仔细 地 更 新 了 本 书 ， 以 反映 
所 有 这 些 技术 进展 ， 同 时 还 考虑 到 各 种 ISO 标准 和 IEEE 标 准 这 些 年 来 的 
变化 。 因 此 ， 他 的 例子 是 最 新 的 ， 也 是 最 新 测试 过 的 。 
































AŽ, 这 是 一 本 弥 足 珍贵 4 经典 著作 的 更 新 版 。 
Dennis Ritchie 


2005 年 3 月 于 新 泽 西 州 默 里 山 市 


引言 
从 我 第 一 次 修订 《UNIX 环 境 高 级 编程 》 一 书 以 来 已 经 快 有 8 年 了 ， 
期 间 发 生 了 很 多 的 变化 。 

在 出 版 第 2 版 之 前 ，Open ”Group 完 成 了 2004 版 的 Single UNIX 
Specification， 它 涵盖 了 两 套 勘误 表 的 修改 。2008 年 ，Open ”Group 完成 
了 新 版 的 Single UNIX Specification， 它 更 新 了 基本 定义 ， 添 加 了 新 的 接 
口 ， 并 且 去 除了 弃 用 的 接口 。 这 套 规范 被 称 为 2008 年 版 的 POSIX.1， 其 
中 包含 第 7 版 的 基本 规范 ， 并 在 2009 年 发 行 。2010 年 ， 它 与 更 新 后 的 
curses 接 口 捆绑 ， 一 起 作为 Single UNIX Specification 4h (SUSv4) 进 
行 再 版 。 

运行 在 Intel 处 理 器 上 的 Mac OS X 操 作 系 统 的 10.5、10.6 和 10.8 
版 ， 被 Open Group 认 证 为 UNIX 系 统 。 

苹果 公司 停止 了 PowerPC 平 台 上 Mac OS X 的 开发 。 在 10.6 发 行 版 
(Snow Leopard) 之 后 只 针对 x86 平 台 发 布 了 新 的 操作 系统 版 本 。 

Solaris 操 作 系 统 以 开源 的 形式 发 布 ， 试 图 与 FreeBSD、Linux 和 
Mac OS X 遵 循 的 开源 模式 在 声望 上 一 争 高 下 。 在 2010 年 ，Oracle 收 购 了 
Sun Microsystems 之 后 ，OpenSolaris 的 开发 被 终止 。 作 为 蔡 代 ，Solaris 社 
区 组 建 了 Ilumos 项 目 来 继续 基于 OpenSolaris ”的 开源 开发 。 更 多 详细 的 
信息 可 以 从 http://www.illumos.org 获 得 。 

2011 年 ，C 语 言 标准 被 更 新 ， 但 是 因为 系统 并 未 能 跟 上 其 变化 ， 
本 书 中 依然 参照 1999 版 。 

最 重要 的 是 ， 在 第 2 版 中 使 用 的 平台 已 经 过 时 了 。 本 书 这 一 版 中 涉 
及 以 下 平台 。 

(1) FreeBSD 8.0， 前 身 是 加 州 大 学 伯克利 分 校 计 算 机 系统 研究 组 
发 布 的 4.4BSD 系 统 ， 运 行 在 32 位 Intel Pentium 处 理 器 上 。 

(2) Linux 3.2.0 (Ubuntu 12.04 发 布 版 ) ， 这 是 一 个 免费 的 类 UNIX 
操作 系统 ， 运 行 在 64 位 的 Intel Core i5 处 理 器 上 。 

(3) Apple Mac OS X 10.6.8 版 “Darwin 10.8.0) ， 运 行 在 64 位 Intel 
Core2 Duo 处 理 器 上 (Darwin 基于 FreeBSD 和 Mach) 。 我 选择 从 PowerPC 
平台 转向 Intel 平 台 ， 是 因为 最 新 版 的 Mac OS X 不 再 文 持 PowerPC 平 台 。 
这 次 选择 带 来 的 缺点 是 涉及 的 处 理 器 倾斜 问 了 Intel， 而 当 讨 论 到 异 构 性 





问题 时 ， 涉 及 的 处 理 絮 如 有 果 能 在 字 市 序 和 整数 大 小 等 方面 有 不 同 的 性 质 
将 是 很 有 好 处 的 。 

(4) Solaris 10, Sun Microsystems 〈 现 在 的 Oracle) 的 System V 
Release 4 的 派生 系统 ， 运 行 在 64 位 UltraSPARC IIi 处 理 器 上 。 

与 第 2 版 的 不 同 

最 大 的 变化 之 一 是 POSIX.1-2008 中 的 Single UNIX Specification H 
了 一 些 STREAMS 相 关 接 口 。 这 是 准备 在 该 标准 的 未 来 版 本 中 去 掉 全 部 
这 些 接 口 过 程 的 第 一 步 。 因 此 ， 我 已 经 不 情愿 地 在 这 一 厂 中 删除 了 
STREAMS 的 内 容 。 这 是 一 个 不 六 的 变化 ， 因 为 STREAMS 接 口 为 socket 
接口 提供 了 一 个 很 好 的 对 照 ， 并 且 在 很 多 方面 更 为 灵活 。 不 可 人 否认， 当 
谈论 到 STREAMS 时 我 并 非 绝对 公正 ， 但 是 坚 无 疑问 的 是 ， 在 现 有 系统 
中 它 的 分 量 已 经 减轻 。 

Linux 基 础 系统 中 未 包含 STREAMS， 虽 然 添加 该 功能 的 包 (LiS 
和 OpenSS7) 是 可 用 的 。 
虽然 Solaris 10 中 包含 了 STREAMS， 但 是 Solaris 11 的 socket 实 现 
并 没有 构建 在 STREAMS 之 上 。 
Mac OS X 不 包含 STREAMS 文 持 。 
FreeBSD 不 包含 STREAMS 支 持 〈 也 从 未 包含 过 ) 。 

随 厦 STREAMS 相 关内 容 的 去 除 ， 新 的 主题 变 得 有 机 会 蔡 代 它 ， 例 
如 POSIX 异 步 /O。 

在 本 书 第 2 版 中 ，Linux 版 本 是 基于 2.4 版 的 。 在 这 次 的 版 本 中 ， 我 们 
己 经 更 新 到 了 3.2 版 。 两 个 版 本 的 最 大 不 同 之 一 是 线程 系统 。 在 Linux 
2.4 和 Linux 2.6 之 间 ， 线 程 的 实现 变 为 Native POSIX Thread 
Library (NPTL) 。NPTL 使 得 Linux 线 程 的 行为 与 其 他 系统 的 线程 更 加 
相似 。 

总 的 来 说 ， 这 次 的 版 本 涵盖 了 超过 70 个 新 的 接口 ， 包 括 处 理 异 步 
IO、 目 旋 锁 、 屏 障 和 POSIX 信 和 号 量 等 接口 。 除 了 一 些 普 近 使 用 的 接口 
eae 的 接口 均 被 删除 。 

致 诗 

许多 读者 为 第 2 版 寄 来 了 评论 和 错误 报告 。 我 很 感谢 他 们 提高 了 第 2 
版 的 准确 性 。 下 面 提 及 的 各 位 是 最 早 提出 建议 或 者 指出 错误 的 ; Seth 
Arnold, Luke Bakken, Rick Ballard. Johannes Bittner. David Bronder、 
Vlad Buslov. Peter Butler, Yuching Chen, Mike Cheng. Jim Collins, 
Bob Cousins, Will Dennis. Thomas Dickey. Loic Domaigné. Igor 
Fuksman, Alex Gezerlis. M. Scott Gordon, Timothy Goya, Tony 
Graham. Michael Hobgood, Michael Kerrisk、 Youngho Kwon, Richard 
Li, Xueke Liu, Yun Long, Dan McGregor, Dylan McNamee. Greg 

















Miller, Simon Morgan, Harry Newton, Jim Oldfield. Scott Parish, 
Zvezdan Petkovic, David Reiss. Konstantinos Sakoutis. David Smoot, 
David Somers, Andriy Tkachuk, Nathan Weeks, Florian Weimer, 
Qingyang Xu 和 Michael Zalokar. 

技术 审 校 者 也 提高 了 内 容 的 准确 性 ， 感 谢 Steve Albert、Bogdan 
Barbu 和 Robert Day。 特 别 感谢 Geoff Clare 和 Andrew Josey 为 Single UNIX 
Specification 的 升华 和 第 2 章 的 准确 性 提供 了 帮助 。 男 外 ， 感 谢 Ken 
Thompson 对 历史 问题 做 出 了 解答 。 

我 得 再 一 次 说 ， 与 Addison-Wesley 的 工作 人 员 的 合作 非常 愉快 。 
感谢 “Kim Boedigheimer、 Romny French, John Fuller, Jessica 
Goldstein, Julie Nahil 和 Debra Williams-Cauley， 此 外 ， 感 谢 Jil Hobbs 在 
这 段 时 间 提 供 了 她 的 专业 审 稿 能 力 。 

最 后 ， 感 谢 我 的 家 人 对 我 在 这 次 再 版 上 花费 了 如 此 多 时 间 给 予 的 理 

和 以 前 一 样 ， 书 中 实例 的 源码 可 以 从 www.apuebook.com 上 获得 ， 
我 非常 欢迎 读者 发 来 邮件 ， 发 表 评 论 ， 提 出 建议 ， 订 正 错误 。 

Stephen A. Rago sar@apuebook.com 

2 013 年 1 月 于 新 泽 西 州 沃 伦 市 

aa a 

我 与 Rich Stevens 最 早 是 通过 电子 邮件 开始 交往 的 ， 当 时 我 发 邮件 
报告 他 的 第 一 本 书 《UNIX 网 络 编程 》 的 一 个 排版 错误 。 他 回信 开玩笑 
说 我 是 第 一 个 给 他 发 这 本 书 勘误 的 人 。 到 他 1999 年 故去 之 前 ， 我 们 会 
时 不 时 地 通 一 些 邮 件 ， 一 般 都 是 在 有 了 问题 认为 对 方 能 解答 的 时 候 。 我 
并 共 进 晚餐 ，Rich 在 会 议 中 给 大 家 做 

培训 。 

Rich Stevens 真 是 个 益友 ， 行 为 举止 很 有 绅士 风度 。 我 在 1993 年 写 
《UNIX 系 统 V 网 络 编 程 》 时 ， 试 图 把 书写 成 他 的 《UNIX 网 络 编程 》 的 
系统 V 版 。Rich 高 兴 地 为 我 审阅 了 好 几 间 ， 并 不 把 我 当成 苑 争 对 手 ， 而 
是 当 作 一 起 写 书 的 同事 。 我 们 曾 多 次 谈 到 要 合作 给 他 的 《TCP/IP 详 解 》 
写 个 STREAMS 版 。 天 和 大 有 情 ， 我 们 或 许 已 经 完成 了 这 个 心愿 。 然 而 ， 
Rich 已 经 营 乔 西 去 ， 修 订 《UNIX 环 境 高 级 编程 》 束 成 为 我 跟 他 一 起 写 
书 的 最 易 实 现 的 方式 。 

当 Addison-Wesley 公 司 的 编辑 找到 我 说 想 修订 Rich 的 这 本 书 时 ， 我 
第 一 反应 是 这 本 书 没 有 多 少 要 改 的 。 尽 管 13 年 过 去 了 ，Rich 的 书 还 是 
族 然 虑 立 。 但 是 ， 与 当初 本 书 出 版 的 时 候 相 比 ， 今 日 的 UNIX 行 业已 经 
有 了 巨大 的 变化 。 


























系统 V 的 各 个 变种 渐渐 被 Linux 所 取代 。 原 来 生产 硬件 配 以 各 目的 
UNIX 版 本 的 几 个 主要 厂商 ， 要 么 提供 了 Linux 的 移植 版 本 ， 要 么 宣布 支 
持 Linux。Solaris 可 能 算是 硕果 仅 存 的 占有 一 定 市 场 份 额 的 UNIX 系 统 V 
版 本 4 的 后 裔 了 。 

加 州 大 学 伯克利 分 校 的 CSRG 〈 计 算 机 科学 研究 组 ) 在 发 布 了 
4.4BSD 之 后 ， 已 经 决定 不 再 开发 UNIX 操 作 系 统 ， 只 有 几 个 志愿 者 小 组 
还 维护 着 一 些 可 公开 获得 的 版 本 。 

Linux 得 到 数 以 千 计 的 志愿 者 的 支持 ， 它 的 引入 使 任何 一 个 拥有 
计算 机 的 人 都 能 运行 类 似 于 UNIX 系统 的 操作 系统 ， 并 且 可 以 免费 获得 
源 代码 支持 哪怕 最 新 的 硬件 设备 。 在 已 经 存在 几 种 免费 BSD 版 本 的 情况 
下 ，Linux 的 成 功 确 实 是 个 奇迹 。 

苹果 公司 作为 一 个 富有 创新 精神 的 公司 ， 己 经 放弃 了 老 的 Mac 
操作 系统 ， 取 而 代 之 的 是 一 个 在 Mach 和 FreeBSD 基 础 上 开发 的 新 系统 。 

因此 ， 我 已 经 努力 更 新 本 书 中 的 内 容 ， 以 反映 这 4 种 平台 。 

在 Rich 1992 年 出 版 了 《UNIX 环 境 高 级 编程 》 之 后 ， 我 扔 掉 了 手头 
几乎 所 有 的 UNIX 程 序 员 手 册 。 这 些 年 来 ， 我 桌 上 最 常 摆 放 的 就 是 两 本 
书 ， 一 本 是 字典 ， 另 一 本 就 是 《UNIX 环境 高 级 编程 》。 我 希望 读者 也 
能 认为 本 修订 版 一 样 有 用 。 

对 第 1 版 的 改动 

Rich ”的 书 依然 屹立 ， 我 试图 不 去 改动 他 这 本 书 原来 的 风格 。 但 是 
13 年 间 志 事 兴 衰 ， 尤 其 是 影响 UNIX 编 程 接口 的 有 关 标 准 变 化 很 大 。 

我 依据 标准 化 组 织 的 标准 ， 更 新 了 全 书 相 关 的 接口 方面 的 内 容 。 第 
2 章 改 动 较 大 ， 因 为 它 主 要 是 讨论 标准 的 。 本 书 第 1 版 是 根据 POSIX.1 标 
准 的 1990 年 版 写 的 ， 本 修订 版 依据 2001 年 版 的 新 标准 ， 内 容 要 丰富 很 
多 。1990 年 ISO 的 C 标 准 在 1999 年 也 更 新 了 ， 有 些 改动 影响 到 POSIX.1 标 
准 中 的 接口 。 

目前 的 POSIX.1 规 范 涵盖 了 更 多 的 接口 。Open Group 〈 原 称 
X/Open) 发 布 的 “Single UNIX Specification” 的 基本 规范 现在 已 经 并 入 
POSIX.1， 后 者 包含 了 几 个 1003.1 标准 和 另外 几 个 标准 草案 ， 原 来 这 些 
标准 是 分 开 出 版 的 。 

我 也 相应 地 增加 了 些 章节 ， 讨 论 新 主题 。 线 程 和 多 线程 编程 是 相当 
重要 的 概念 ， 因 为 它们 为 程序 员 处 理 并 发 和 异步 提供 了 更 清楚 的 方式 。 

套 接 字 接口 现在 也 是  POSIX.1 ”的 一 部 分 了 。 它 为 进程 间 通 信 
> 提供 了 单一 的 接口 ， 而 不 考虑 进程 的 位 置 。 它 成 为 IPC 章 节 的 自 
然 扩 展 。 

我 省 略 了 POSIX.1 中 的 大 部 分 实时 接口 。 这 些 内 容 最 好 是 在 一 本 专 
门 讲述 实时 编程 的 书 中 介绍 。 参 考 文 献 里 有 一 本 这 方面 的 书 。 





























我 把 最 后 面 几 间 的 案例 研究 也 更 新 了， 用 了 更 接近 现实 的 例子 。 例 
如 ， 现 在 很 少 有 系统 通过 串口 或 并 口 连 接 ” PostScript 打印 机 了 ， 多 数 
PostScript 打印 机 是 通过 网 络 连接 的 ， 所 以 我 对 PostScript 打 印 机 通信 的 
例子 做 了 修改 。 

有 关 调 制 解 调 器 通信 的 那 一 章 如 今 已 经 不 太 适 用 了 。 原 始 材料 我 们 
保留 在 本 书 网 站 上 ， 有 两 种 格式 : 

PostScript (http://www.apuebook.com/lostchapter/modem.ps) 和 
PDF (http://www. apuebook.com/lostchapter/modem.pdf) 。 

书 中 实例 的 源 代 码 也 可 以 从 www.apuebook.com 上 获得 。 多 数 实 例 
已 经 在 下 述 4 种 平台 上 运行 过 了 。 

(1) FreeBSD 5.2.1， 是 加 州 大 学 伯克利 分 校 CSRG 的 4.4BSD 的 一 
个 变种 ， 在 英特尔 奔腾 处 理 器 上 运行 。 

(2) Linux 2.4.22 (Mandrake 9.2 发 布 ) ， 是 一 个 免费 的 类 UNIX 操 
作 系统 ， 运 行 于 英特尔 奔腾 处 理 右 上 。 

(3) Solaris 9， 是 Sun 公 司 系统 V 版 本 4 的 变种 ， 运 行 于 64 位 的 
UltraSPARC II 处理 左上。 

(4) Darwin 7.4.0， 是 基于 FreeBSD 和 Mach 的 操作 系统 环境 ， 也 是 
Apple Mac OS X 10.3 版 本 的 核心 ， 运 行 于 PowerPC 处 理 器 上 。 
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本 书 描述 了 UNIX 系 统 的 程序 设计 接口 系统 调用 接口 和 标准 C 库 
提供 的 很 多 函数 。 本 书 针对 的 是 所 有 的 程序 员 。 

与 大 多 数 操作 系统 一 样 ，UNIX 为 程序 运行 提供 了 大 量 的 服务 一 一 
打开 文件 、 读 文件 、 启 动 一 个 新 程序 、 分 配 存 储 区 以 及 获得 当前 时 间 
等 。 这 些 服务 被 称 为 系统 调用 接口 (system call interface) 。 另 外 ， 标 
准 C 库 提供 了 大 量 广 泛 用 于 C 程 序 中 的 函数 (格式 化 输出 变量 的 值 、 比 
较 两 个 字符 串 等 ) 。 

系统 调用 接口 和 库 函 数 可 参见 《UNIX 程 序 员 手册 》 第 2、3 部 分 。 
本 书 不 是 这 些 内 容 的 重复 。 手 册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 则 
正 是 本 书 所 要 讲述 的 内 容 。 

UNIX 标 准 

20 世 纪 80 年 代 出 现 了 各 种 版 本 的 UNIX，20 世 纪 80 年 代 后 期 ， 人 们 
在 此 基础 上 制定 了 数 个 国际 标准 ， 包 括 C 程 序 设计 语言 的 ANSI 标准 、 
IEEE POSIX 标准 系列 〈 还 在 制定 中 ) 、X/Open 可 移植 性 指南 。 

本 书 也 介绍 了 这 些 标 准 ， 但 是 并 不 只 是 说 明 标准 本 身 ， 而 是 着 重 说 
明 它 们 与 应 用 广泛 的 一 些 实现 (主要 指 SVR4 以 及 即将 发 布 的 4.4BSD) 
之 间 的 关系 。 这 是 一 种 贴近 现实 世界 的 描述 ， 而 这 正 是 标准 本 身 以 及 仅 
描述 标准 的 文献 所 缺少 的 。 

本 书 的 组 织 

本 书 分 为 以 下 6 个 部 分 。 

(1) 对 UNIX 程 序 设 计 基 本 概念 和 术语 的 简要 描述 〈 第 1 章 ) ， 以 
及 对 各 种 UNIX 标 准 化 工作 和 不 同 UNIX 实 现 的 讨论 〈 第 2 章 ) 。 

(2) W/O 一 一 不 带 缓 存 的 VO (3H) 、 文 件 和 日 录 (第 4 章 ) 、 标 
准 WO 库 (第 5 章 ) 和 标准 系统 数据 文件 (第 6 章 ) 。 

(3) 进程 一 一 UNIX 进 程 的 环境 (第 7 章 ) 、 进 程控 制 〈 第 8 章 ) 、 
进程 之 间 的 关系 (第 9 章 ) 和 信号 (第 10 章 ) 。 

(4) 更 多 的 IO 终端 O《〈 第 11 章 ) 、 高 级 MO (12%) 和 守 
护 进程 〈 第 13 章 ) 。 

(5) IPC 一 一 程 间 通信 《第 14 章 和 第 15 章 ) 。 

(6) 实例 一 一 个 数据 库 的 函数 库 〈 第 16 章 ) 、 与 PostScript 打印 机 
的 通信 《第 17 章 ) 、 调 制 解 调 器 拨号 程序 〈 第 18 章 ) 和 使 用 伪 终 端 〈 第 
19 章 ) 。 

如 果 对 C 语 言 较 熟悉 并 具有 某 些 应 用 UNIX 的 经 验 ， 对 学 习 本 书 将 非 
常 有 益 ， 但 是 并 不 要 求 读者 必须 具有 UNIX 编 程 经 验 。 本 书面 向 的 读者 









































主要 是 : 熟悉 UNIX 的 程序 员 ， 以 及 熟悉 其 他 某 个 操作 系统 且 和 希望 了 解 
大 多 数 UNIX 系 统 提供 的 各 种 服务 细节 的 程序 员 。 

本 书 中 的 实例 

本 书包 含 了 大 量 实例 一 一 大 约 10 000 行 源 代码 。 所 有 实例 都 用 ANSI 
C 语 言 编写 。 在 阅读 本 书 时 ， 建 议 准 备 一 本 你 所 使 用 的 UNIX 系 统 的 

《UNIX 程 序 员 手 册 》， 在 细节 方面 有 时 需要 参考 该 手册 。 

几乎 对 于 每 一 个 函数 和 系统 调用 ， 本 书 都 用 一 个 小 的 完整 的 程序 进 
行 了 演示 。 这 可 以 让 读者 清楚 地 了 解 它 们 的 用 法 ， 包 括 参 数 和 返回 值 
等 。 有 些小 程序 还 不 足以 说 明 库 函数 和 系统 调用 的 复杂 功能 和 应 用 技 
巧 ， 所 以 书 中 还 包含 了 一 些 较 大 的 实例 〈 见 第 16 间 人 至 第 19 间 ) 。 

所 有 实例 的 源 代码 文件 都 可 在 因特网 上 用 匿名 ftp 从 因特网 主机 
ftp.uu.net 的 published/books/stevens. advprog.tar.Z 文 件 下 载 。 读 者 可 以 在 
自己 的 机 器 上 修改 并 运行 这 些 源 代码 。 

用 于 测试 实例 的 系统 

遗憾 的 是 ， 所 有 的 操作 系统 都 在 不 断 变 更 ，UNIX 也 不 例外 。 下 图 
给 出 了 系统 V 和 4.xBSD 最 近 的 进展 情况 。 
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| | 
XPG3 ANSI C POSIX. 
4.xBSD 是 由 加 州 大 学 伯克利 分 校 CSRG 开 发 的 。 该 小 组 还 发 布 了 
BSD Net1 和 BSD Net2 版 ， 其 公开 的 源 代码 源 自 4.xBSD 系 统 。SVRx 表 示 
AT&T 的 系统 V 第 x 版 。XPG3 指 X/Open 可 移植 性 指南 的 第 3 个 发 行 版 。 
ANSI C 是 C 语 言 的 ANSI 标 准 。POSIX.1 是 IEEE 和 ISO 的 类 UNIX 系 统 接口 
标准 。2.2 节 和 2.3 节 将 对 这 些 标准 和 不 同 版 本 之 间 的 差别 做 更 多 的 说 
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l 本 书 中 用 4.3+BSD 表 示 源 自 伯 元 利 的 介 于 BSD Net2 和 4.4BSD 之 间 


的 UNIX 系 统 。 

在 本 书写 作 时 ，4.4BSD 尚未 发 布 ， 所 以 还 不 能 称 之 为 4.4BSD。 为 
了 用 一 个 简单 的 名 字 来 引用 该 系统 ， 故 使 用 4.3+BSD。 

本 书 中 的 大 多 数 实例 曾 在 下 面 4 种 UNIX 系 统 上 运行 过 。 

(1) U.H 公 司 (UHC) 的 UNIX 系 统 V/386 R4.0.2 (vanilla 
SVR4) ， 运 行 于 Intel 80386 处 理 器 上 。 

(2) 加 州 大 学 伯克利 分 校 CSRG 的 4.3+BSD， 运 行 于 惠普 工作 站 








(3) 伯克利 软件 设计 公司 的 BSD/386 (是 BSD ”Net2 的 变种 ) ， 运 
行 于 Intel 80386 处 理 器 上 。 该 系统 与 4.3+BSD 儿 乎 相同 。 

(4) Sun 公 司 的 SunOS 4.1.1 和 4.1.2〈 该 系统 与 伯克利 系统 有 很 深 的 
渊源 ， 但 也 包含 了 许多 系统 V 的 特性 ) ， 运 行 于 SPARCstation SLC 上 。 

本 书 还 提供 了 许多 对 系统 进行 的 时 间 测 试 ， 并 注 明 了 用 于 测试 的 实 
际 系统 。 
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其 他 朋友 在 过 去 这 些 年 以 各 种 方式 提供 了 帮助 ， 看 似 不 大 ， 却 非常 
重要 。 他 们 是 Paul Lucchina、Joe Godsil、Jim Hogue、Ed Tankus 和 Gary 
Wright。 本 书 的 编辑 是 Addison-Wesley 公 司 的 John Wait， 他 自始至终 是 
我 的 忠实 朋友 。 我 不 断 地 延期 交 稿 ， 写 作 篇 幅 也 一 再 超过 计划 ， 他 从 不 
FAS Rp al BRN Se BOCA MG (NOAO) ， 尤 其 是 Sidney 
Wolff. Richard Wolff 和 Steve Grandi， 为 我 提供 准确 的 计算 机 时 间 。 








真正 的 UNIX 图 书 应 该 用 troff 写 成 ， 本 书 也 遵循 了 这 一 优秀 传统 。 
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所 有 操作 系统 都 为 它们 所 运行 的 程序 提供 服务 。 典 型 的 服务 包括 : 
执行 新 程序 、 打 开 文 件 、 读 文件 、 分 配 存储 区 以 及 获得 当前 时 间 等 ， 本 
书 集中 冰 述 不 同 版 本 的 UNIX 操 作 系 统 所 提供 的 服务 。 

想 要 按 严格 的 先后 顺序 介绍 UNIX， 而 不 超前 引用 尚未 介绍 过 的 术 
语 ， 这 几乎 是 不 可 能 的 (可 能 也 会 令 人 厌烦 ) 。 本 章 从 程序 员 的 角度 快 
速 浏览 UNIX， 对 书 中 引用 的 一 些 术语 和 概念 进行 简要 的 说 明 并 给 出 实 
例 。 在 以 后 各 章 中 ， 将 对 这 些 概念 做 更 详细 的 说 明 。 对 于 初 涉 UNIX 环 
境 的 程序 员 ， 本 章 还 简要 介绍 了 UNIX 提 供 的 各 种 服务 。 











1.2 UNIX Zi W 


从 严格 意义 上 说 ， 可 将 操作 系统 定义 为 一 种 软件 ， 它 控制 计算 机 硬 
件 资源 ， 提 供 程序 运行 环境 。 我 们 通常 将 这 种 软件 称 为 内 核 
(kernel) ， 因 为 它 相 对 较 小 ， 而 且 位 于 环境 的 核心 。 图 1-1 显 示 了 
UNIX 系 统 的 体系 结构 。 

内 核 的 接口 被 称 为 系统 调用 (system call， 图 1-1 中 的 阴影 部 分 ) 。 
公用 函数 库 构 建 在 系统 调用 接口 之 上 ， 应 用 程序 既 可 使 用 公用 函数 库 ， 
也 可 使 用 系统 调用 。 (我 们 将 在 。” 1.11 节 对 系统 调用 和 库 函 数 做 更 多 说 
明 。) shell 是 一 个 特殊 的 应 用 程序 ， 为 运行 其 他 应 用 程序 提供 了 一 个 接 
ap 









应 用 程序 
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图 1-1 UNIX 操 作 系统 的 体系 结构 
从 广义 上 说 ， 操 作 系统 包括 了 内 核 和 一 些 其 他 软件 ， 这 些 软件 使 得 








计算 机 能 够 发 挥 作 用 ， 并 使 计算 机 具有 自己 的 特性 。 这 里 所 说 的 其 他 软 
件 包括 系统 实用 程序 (system utility) 、 应 用 程序 、shell 以 及 公用 函数 


库 等 。 
例如 ，Linux 是 GNU 操 作 系 统 使 用 的 内 核 。 一 些 人 将 这 种 操作 系统 
称 为 GNU/Linux 操 作 系 统 ， 但 是 ， 更 常见 的 是 简单 地 称 其 为 Linuxo R 
然 这 种 表达 方法 在 严格 意义 上 讲 并 不 正确 ， 但 鉴于 “操作 系统 ”这 个 词 的 

双重 含义 ， 这 种 叫 法 还 是 可 以 理解 的 〈 这 样 的 叫 法 更 简洁 ) o 





1.3 登录 


1. 登录 名 

用 户 在 登录 UNIX 系 统 时 ， 先 键入 登录 名 ， 然 后 键入 口令 。 系 统 在 
其 口令 文件 (通常 是 /etc/passwd 文 件 ) 中 查看 登录 名 。 口 令 文件 中 的 登 
录 项 由 7 个 以 冒号 分 隔 的 字段 组 成 ， 依 次 是 : 登录 名 、 加 密 口令 、 数 字 
用 户 ID (205) 、 数 字 组 ID (105) 、 注 释 字 段 、 起 始 目 录 (/home/sar) 
以 及 shell 程 序 (/bin/ksh) 。 

sar:x:205:105:Stephen Rago:/home/sar:/bin/ksh 

目前 ， 所 有 的 系统 已 将 加 密 口 令 移 到 另 一 个 文件 中 。 第 6 章 将 说 明 
这 种 文件 以 及 访问 它们 的 函数 。 

2. shell 

用 户 登 录 后 ， 系 统 通 常 先 显示 一 些 系统 信息 ， 然 后 用 户 就 可 以 同 
shell ”程序 键入 命令 。【〔 当 用 户 登 录 时 ， 某 些 系 统 启 动 一 个 视窗 管理 程 
序 ， 但 最 终 总 会 有 一 个 shell 程序 运行 在 一 个 视窗 中 ) 。shell 是 一 个 命 
令 行 解释 器 ， 它 读 取 用 户 输入 ， 然 后 执行 命令 。shell 的 用 户 输 入 通常 来 
自 于 终端 《交互 式 shell) ， 有 时 则 来 自 于 文件 〈 称 为 shell 脚 本 ) . Al1-2 
总 结 了 UNIX 系 统 中 常见 的 shell。 
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Bourne shell in bash 的 副本 
Bourne-again shell in piai ， 
C shell in 链接 至 tcsh if 链接 至 tcsh 
Korn shell in 可 选 的 nai ‘ 
TENEX C shell in ER ， 




















图 1-2 UNIX 系 统 中 常见 的 shell 
系统 从 口令 文件 中 相应 用 户 登 录 项 的 最 后 一 个 字段 中 了 解 到 应 该 为 
该 登录 用 户 执 行 哪 一 个 shell。 
自 V7 以 来 ， 由 Steve Bourne 在 贝尔 实验 室 开 发 的 Bourne shell 得 到 了 
广泛 应 用 ， 几 乎 每 一 个 现 有 的 UNIX 系 统 都 提供 Bourne shell， 其 控制 流 








结构 类 似 于 Algol 68。 

C ”shell 是 由 Bill ”Joy 在 伯克利 开发 的 ， 所 有 BSD 版 本 都 提供 这 种 
shell。 另 外 ，AT&T 的 System V/386 R3.2 和 System V R4 (SVR4) 也 提 
GEC shell (下 一 章 将 对 这 些 不 同 版 本 的 UNIX 系 统 做 更 多 说 明 ) 。C shell 
古 在 第 6 版 shell 而 非 Bourne ”shell 的 基础 上 构造 的 ， 其 控制 流 类 似 于 C 语 
言 ， 它 文 持 Bourne shell 没 有 的 一 些 特色 功能 ， 例 如 作业 控制 、 历 史 机 制 
以 及 命令 行 编辑 等 。 

Korn shell 是 Bourme shell 的 后 继 者 ， 它 首先 在 SVR4 中 提供 。Kor 
shel] 是 由 贝尔 实验 室 的 David Korn 开 发 的 ， 在 大 多 数 UNIX 系 统 上 运行 ， 
但 在 SVR4 之 前 ， 通 常 它 需要 另行 购买 ， 所 以 没有 其 他 两 种 shell 流行 。 
它 与 Boume shell 向 上 兼容 ， 并 具有 使 C shell 广 泛 得 到 应 用 的 一 些 特 色 功 
能 ， 包 括 作 业 控 制 以 及 命令 行 编辑 等 。 

Bourne-again shell 是 GNU shell， 所 有 Linux 系 统 都 提供 这 种 shell。 它 
的 设计 遵循 POSIX 标 准 ， 同 时 也 保留 了 与 Bourne shell 的 兼容 性 。 它 文 
持 C shell 和 Korn shell 两 者 的 特色 功能 。 

TENEX C shell 是 C shell 的 加 强 版 本 。 它 从 TENEX 操 作 系 统 (1972 
年 BBN 公 司 开 发 ) 借鉴 了 很 多 特色 ， 例 如 命令 完备 。TENEX C shell 在 C 
shell 基 础 上 增加 了 很 多 特性 ， 凋 被 用 来 答 换 C shell。 

POSIX 1003.2 标 准 对 shell 进 行 了 标准 化 。 这 项 规范 基于 Korn shell fl 
Bourne shell 的 特性 。 

不 同 的 Linux 系 统 使 用 不 同 的 默认 shell。 一 些 Linux 默 认 使 用 Bourne- 
again shell。 另 外 一 些 使 用 BSD 的 对 Bourne shell 的 替代 品 dash (Debian 
Almquist shell， 最 早 由 Kenneth Almquist 开 发 ， 并 在 后 来 移植 入 
Linux) 。EFreeBSD 的 默认 用 户 shell 衍 生 于 Almquist shell. Mac OS X 的 默 
认 shell 是 Boume-again shell. 

Solaries 继 承 了 BSD 和 System V 两 者 ， 它 提供 了 图 1-2 中 所 示 的 所 有 
shell。 在 因特网 上 可 以 找到 shell 的 自由 移植 版 软件 。 

本 书 将 使 用 这 种 形式 的 注释 来 描述 历史 注释 ， 并 对 不 同 的 UNIX 系 
统 的 实现 进行 比较 。 当 我 们 了 解 到 历史 缘由 后 ， 会 更 好 地 理解 采用 某 种 
特定 实现 技术 的 原因 。 

本 书 将 使 用 很 多 交互 式 shell 实 例 来 执行 所 开发 的 程序 ， 这 些 实例 使 
用 了 Bourmne shell. Korn shell 和 Bourne-again shell 通 用 的 功能 。 
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1.4 HES 


1. 文件 系统 

UNIX 文 件 系 统 是 目录 和 文件 的 一 种 层次 结构 ， 所 有 东西 的 起 点 是 
BRAK Croot) 的 目录 ， 这 个 目录 的 名 称 是 一 个 字符 “/”。 

目录 (directory) 是 一 个 包含 目录 项 的 文件 。 在 逻辑 上 ， 可 以 认为 
每 个 目录 项 都 包含 一 个 文件 名 ， 同 时 还 包含 说 明 该 文件 属性 的 信息 。 文 
件 属性 是 指 文件 类 型 〈 是 普通 文件 还 是 目录 等 ) 、 文 件 大 小 、 文 件 所 有 
者 、 文 件 权 限 〈 其 他 用 户 能 否 访问 该 文件 ) 以 及 文件 最 后 的 修改 时 间 
等 。stat 和 fstat 函 数 返 回 包 含 所 有 文件 属性 的 一 个 信息 结构 。 第 4 章 将 详 
细 说 明文 件 的 各 种 属性 。 

目录 项 的 逻辑 视图 与 实际 存放 在 磁盘 上 的 方式 是 不 同 的 。UNIX X 
件 系 统 的 大 多 数 实现 并 不 在 目录 项 中 存放 属性 ， 这 是 因为 当 一 个 文件 具 
有 多 个 硬 链接 时 ， 很 难保 持 多 个 属性 副本 之 间 的 同步 。 这 一 点 将 在 第 4 
章 讨论 便 链 接 时 理解 得 更 明晰 。 

2. 文件 名 

日 录 中 的 各 个 名 字 称 为 文件 名 (flename) 。 只 有 和 斜 线 O 和 空 字 
符 这 两 个 字符 不 能 出 现在 文件 名 中 。 和 斜 线 用 来 分 隔 构成 路 径 名 的 各 文件 
名 ， 空 字符 则 用 来 终止 一 个 路 径 名 。 尽 管 如 此 ， 好 的 习惯 还 是 只 使 用 党 
用 印刷 字符 的 一 个 子 集 作 为 文件 名 字符 《〈 如 有 果 在 文件 名 中 使 用 了 某 些 
shell 的 特殊 字符 ， 则 必须 使 用 shell 的 引号 机 制 来 引用 文件 名 ， 这 会 带 来 
很 多 麻烦 ) 。 事 实 上 ， 为 了 可 移植 性 ，POSIX.1 推荐 将 文件 名 限制 在 以 
下 字符 集 之 内 : 字母 (a~z、A~Z) 、 数 字 (0~9) 、 句 点 (.) 、 短 
Hizk C) 和 下 划 线 (_) 。 

创建 新 目录 时 会 自动 创建 了 两 个 文件 名 : © OKA) M. BRA 
点 ) 。 点 指 癌 当前 目录 ， 点 点 指 回 父 目录 。 在 最 高 层次 的 根 目 录 中 ， 点 
点 与 点 相同 。 

Research UNIX System 和 某 些 早期 UNIX System V 的 文件 系统 限制 
文件 名 的 最 大 长 度 为 14 个 字符 ，BSD 版 本 则 将 这 种 限制 扩展 为 255 个 字 


3 路径 名 
由 斜 线 分 隅 的 一 个 或 多 个 文件 名 组 成 的 序列 (也 可 以 和 斜 线 开头 ) 构 
AREKE (pathname) ， 以 和 斜 线 开头 的 路 径 名 称 为 绝对 路 径 名 
































(absolute pathname) ， 人 否则 称 为 相对 路 径 名 (relative pathname) 。 相 
对 路 径 名 指向 相对 于 当前 目录 的 文件 。 文 件 系统 根 的 名 字 (/) 是 一 个 
A a aa 
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现 。 








finclude "apue 
#include “dirent ,h> 


int 
main(int argc, char *argv(]) 
| 
DIR *dp; 
struct dirent *dirp; 


if (arge != 2) 
err quit("usage: ls directory name"); 


if ((dp = opendir (argv[1])) == NULL) 
err sys("can't open 5s", argv[1]); 

while ((dirp = readdir(dp)) != NULL) 
printf("ss\n", dirp->d name) ; 


closedir (dp) ; 
exit (0); 


图 1-3 列 出 一 个 目录 中 的 所 有 文件 
ls(1) 这 种 表示 方法 是 UNIX 系统 的 惯用 方法 ， 用 以 引用 UNIX 系统 
手册 中 的 一 个 特定 项 。]s(1) 引 用 第 一 部 分 中 的 ls 项 。 各 部 分 通常 用 数字 








1~8 ”编号 ， 在 每 个 部 分 中 的 各 项 则 按 字 母 顺序 排列 。 在 本 书 中 始终 假 
定 你 有 自己 所 使 用 的 UNIX 系 统 的 手册 。 

早期 的 UNIX 系统 把 8 个 部 分 都 集中 在 一 本 《UNIX 程序 员 手 册 》 
(UNIX Programmer’s Manual) 中 。 随 着 页 数 的 增加 ， 现 在 的 趋势 是 把 
这 些 部 分 分 别 安排 在 不 同 的 手册 中 ， 例 如 用 户 手册 、 程 序 员 手 册 以 及 系 
统管 理 员 手册 等 。 

一 些 UNIX 系 统 用 大 写字 母 把 某 一 部 分 手册 进一步 分 成 若干 小 部 
分 ， 例 如 ，AT&T[1990e] 中 的 所 有 标准 IO 函数 都 被 指明 位 于 3S 部 分 
中 ， 例 如 fopen(3S)。 男 一 些 UNIX 系 统 不 用 数字 而 是 用 字母 将 手册 分 成 
若干 部 分 ， 如 用 C 表 示 命 令 部 分 等 。 

现今 ， 大 多 数 手册 都 以 电子 文档 形式 提供 。 如 果 用 的 是 联机 手册 ， 
则 可 用 下 面 的 命令 查看 ls 命令 手册 页 : 

man 1 ls 

或 

man -s1 ls 

图 1-3 只 打印 一 个 目录 中 各 个 文件 的 名 字 ， 不 显示 其 他 信息 ， 如 果 
该 源 文件 名 为 myls.c， 则 可 以 用 下 面 的 命令 对 其 进行 编译 ， 编 译 结 果 是 
生成 默认 名 为 a.out 的 可 执行 文件 中 。 

cc myls.c 

历史 上 ，cc(1) 是 C 编 译 器 。 在 配置 了 GNU C 编 译 系 统 的 系统 中 ，C 
编译 器 是 gcc(1)。 其 中 ， cc 通常 链接 至 gcc。 

示例 输出 如 下 : 

$ ./a.out /dev 

















cdrom 
stderr 
stdout 
stdin 
fd 
sda4 
sda3 
sda2 
sdal 
sda 
tty2 
tty1 


console 





tty 
Zero 
null 
很 多 行 未 显示 
mem 


$ ./a.out /etc/ssl/private 

can't open /etc/ssl/private: Permission denied 

$ ./a.out /dev/tty 

can't open /dev/tty: Not a directory 

本 书 将 以 以 下 方式 表示 输入 的 命令 及 其 输出 : 输入 的 字符 以 等 宽 粗 
体 表 示 ， 程 序 输出 则 以 上 面 所 示 的 等 宽 字 体 表 示 。 对 输出 的 注释 以 中 文 
宋体 表示 。 输 入 之 前 的 美元 符号 ($) 是 shell 的 提示 符 ， 本 书 总 是 将 
shell 提 示 符 表示 为 $。 

注意 ，myls 程 序列 出 的 目录 中 的 文件 名 不 是 以 字母 顺序 列 出 的 ， 而 
ls 命令 一 般 是 按 字 母 顺序 打印 目录 项 。 

在 这 个 20 行 的 程序 中 ， 有 很 多 细 市 需要 考虑 。 

“首先 ， 其 中 包含 了 一 个 头 文件 apue.h。 本 书 中 几乎 每 一 个 程序 都 包 
含 此 头 文件 。 它 包含 了 菜 些 标准 系统 头 文件 ， 定 义 了 许多 常量 及 函数 原 
型 ， 这 些 都 将 用 于 本 书 的 各 个 实例 中 ， 附 录 B 列 出 了 这 一 头 文件 。 

。 接 下 来 ， 我 们 包含 了 一 个 系统 头 文件 dirent.h， 以 便 使 用 opendir 和 
readdir 的 函数 原型 ， 以 及 dirent 结构 的 定义 。 在 其 他 一 些 系统 里 ， 这 些 




















定义 被 分 成 多 个 头 文 件 。 
比如 ， 在 Ubuntu 12.04 4, /usr/include/dirent.h 声明 了 函数 原型 ， 
并 且 包 含 bits/dirent.h， 后 者 定义 了 dirent 结构 (真正 存放 


7E/usr/include/x86_64-linux-gnu/bits F ) o 

“main 函 数 的 声明 使 用 了 ISO “C 标 准 所 使 用 的 风格 〈 下 一 章 将 对 ISO 
C 标 准 进行 更 多 说 明 ) 。 

“程序 获取 命令 行 的 第 1 个 参数 argv[1] 作 为 要 列 出 其 各 个 目录 项 的 目 
eee ， 程 序 如 何 存 取 命 令 行 参 数 和 

\ 境 变量 。 

“因为 各 种 不 同 UNIX 系统 目录 项 的 实际 格式 是 不 一 样 的 ， 所 以 使 
用 函数 opendir、readdir 和 closedir 对 目录 进行 处 理 。 

“opendir 函 数 返 回 指向 DIR 结 构 的 指针 ， 我 们 将 该 指针 传送 给 readdir 
函数 。 我 们 并 不 关心 ”DIR 结构 中 包含 了 什么 。 然 后 ， 在 循环 中 调用 
readdir 来 读 每 个 目录 项 。 它 返回 一 个 指 问 dirent 结构 的 指针 ， 而 当 目 录 
中 已 无 目录 项 可 读 时 则 返回 null 指针 。 在 dirent 结构 中 取出 的 只 是 每 个 





目录 项 的 名 字 〈d_name) 。 使 用 该 名 字 ， 此 后 束 可 调用 stat 函 数 〈 见 4.2 
W) 以 获得 该 文件 的 所 有 属性 。 

“程序 调用 了 两 个 自 编 的 函数 对 错误 进行 处 理 : err_sys 和 err_quit。 

从 上 面 的 输出 中 可 以 看 到 ，err_sys 函 数 打 印 一 条 消息 (“Permission 
denied” 或 “Not a directory”) ， 说 明 遇 到 了 什么 类 型 的 错误 。 这 两 个 出 错 
处 理 函 数 在 附录 B 中 说 明 ，1.7 节 将 更 多 地 叙述 出 错 处 理 。 

。 当 程序 将 结束 时 ， 它 以 参数 0 调用 函数 exit。 阔 数 exit 终 止 程序 。 按 
惯例 ， 参 数 0 的 意思 是 正常 结束 ， 参 数值 1~~255 则 表示 出 错 。8.5 节 将 说 
明 一 个 程序 (如 shell 或 我 们 所 编写 的 程序 ) 如 何 获得 它 所 执行 的 男 一 个 
程序 的 exit 状 态 。 

4. 工作 目录 

每 个 进程 都 有 一 个 工作 目录 (working directory) ， 有 时 称 其 为 当前 
工作 目录 (current working directory) 。 所 有 相对 路 径 名 都 从 工作 目录 
开始 解释 。 进 程 可 以 用 chdir 函 数 更 改 其 工作 目录 。 

例如 ， 相 对 路 径 名 docmemo/joe 指 的 是 当前 工作 目录 中 的 doc 目 录 中 
的 memo 目 录 中 的 文件 (或 目录 ) joe。 从 该 路 径 名 可 以 看 出 ，doc 和 
memo 都 应 当 是 目录 ， 但 是 却 不 能 分 辨 joe 是 文件 还 是 目录 。 路 径 
名 /urs/ib/lint 是 一 个 绝对 路 径 名 ， 它 指 的 是 根 目录 中 的 usr 目 录 中 的 lib 目 
录 中 的 文件 (或 目录 ) lint. 

5. 起 始 目录 

登录 时 ， 工 作 目 录 设 置 为 起 始 目 录 (home directory) ， 该 起 始 目 录 
从 口令 文件 〈 见 1.3 节 ) 中 相应 用 户 的 登录 项 中 取得 。 














1. 文件 描述 符 

文件 描述 符 〈file descriptor) 通常 是 一 个 小 的 非 钠 整数， 内 核 用 以 
标识 一 个 特定 进程 正在 访问 的 文件 。 当 内 核 打 开 一 个 现 有 文件 或 创建 一 
个 新 文件 时 ， 它 都 返回 一 个 文件 描述 符 。 在 读 、 写 文件 时 ， 可 以 使 用 这 
个 文件 描述 符 。 

2. 标准 输入 、 标 准 输出 和 标准 错误 

按 惯例 ， 每 当 运 行 一 个 新 程序 时 ， 所 有 的 shell 都 为 其 打开 3 个 文 
件 描述 符 ， 即 标准 输入 (standard input) 、 标 准 输出 (standard output) 
以 及 标准 错误 (standard error) 。 如 果 不 做 特殊 处 理 ， 例 如 就 像 简 单 的 
命令 ls， 则 这 3 个 描述 符 都 链接 向 终端 。 大 多 数 shell 都 提供 一 种 方法 ， 使 
其 中 任何 一 个 或 所 有 这 3 个 描述 符 都 能 重新 定 同 到 某 个 文件 ， 例 如 : 

Is > file.list 

执行 ls 命令 ， 其 标准 输出 重新 定 问 到 名 为 fe.list 的 文件 。 

3. 不 带 缓 冲 的 VO 

函数 open、read、write、lseek 以 及 close 提 供 了 不 带 缓冲 的 HO。 这 些 

SE pl 

如 果 愿 意 从 标准 输入 读 ， 并 回 标 准 输出 写 ， 则 图 1-4 中 所 示 的 程序 
可 用 于 复制 任 一 UNIX 普 通 文件 。 








#include "apue ,hm 
#define BUFFSIZE 4096 


int 
main (void) 
| 
int on; 
char buf[BUFESIZE]; 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT FILENO, buf, n) != n) 


err sys("write error"); 


if (n < 0) 


err sys("read error"); 


exit (0); 








图 1-4 将 标准 输入 复制 到 标准 输出 

头 文件 <unistd.h> (apue.h 中 包含 了 此 头 文件 ) 及 两 个 常量 
STDIN_FILENO 和 STDOUT_FILENO 是 POSIX 标 准 的 一 部 分 (下 一 章 将 
对 此 做 更 多 的 说 明 ) 。 头 文件 <unistd.h> 包 含 了 很 多 UNIX 系 统 服务 的 函 
数 原 型 ， 例 如 图 1-4 程 序 中 调用 的 read 和 write。 

两 个 常量 STDIN_FILENO 和 STDOUT _ FILENO 定 义 在 <unistd.h> 头 
文件 中 ， 它 们 指定 了 标准 输入 和 标准 输出 的 文件 描述 符 。 在 POSIX 标 准 
中 ， 它 们 的 值 分 别 是 0O 和 1， 但 是 考虑 到 可 读 性 ， 我 们 将 使 用 这 些 名 字 来 
表示 这 些 常 量 。 

3.9 节 将 详细 讨论 BUFFSIZE 常 量 ， 说 明 它 的 各 种 不 同 值 将 如 何 影响 























但 是 不 管 该 常量 的 值 如 何 ， 此 程序 总 能 复制 任 一 UNIX 普 
通 文 件 。 
read 函 数 返回 读 取 的 字 节 数 ， 此 值 用 作 要 写 的 字 节 数 。 当 到 达 输 入 
文件 的 尾 端 时 ，read 返 回 0， 程 序 停 止 执行 。 如 果 发 生 了 一 个 读 错 误 ， 
read 返 回 -1。 出 错时 大 多 数 系统 函数 返回 -1。 

如 果 将 该 程序 编译 成 标准 名 称 的 aout 文 件 ， 并 以 下 列 方式 执行 它 : 

./a.out > data 

那么 标准 输入 是 终端 ， 标 准 输 出 则 重新 定 问 至 文件 data， 标 准 错误 
也 是 终端 。 如 果 此 输出 文件 并 不 存在 ， 则 shell 会 创建 它 。 该 程序 将 用 户 
键入 的 各 行 复 制 到 标准 输出 ， 键 入 文件 结束 人 符 (通常 是 Ctrl+D)〉 时， 将 
终止 本 次 复制 。 

茶 以 下 列 方式 执行 该 程序 : 

.Ja.out < infile > outfile 

会 将 名 为 infile 文 件 的 内 容 复 制 到 名 为 outfile 的 文件 中 。 

第 3 章 将 更 详细 地 说 明 不 带 缓 冲 的 IO 函数 。 

4. 标准 IO 

标准 IO 函数 为 那些 不 带 缓冲 的 MO 函数 提供 了 一 个 带 缓冲 的 接口 。 
使 用 标准 IO 函数 无 需 担 心 如 何 选 取 最 佳 的 缓冲 区 大 小 ， 如 图 1-4 中 的 
BUFFSIZE 常 量 的 大 小 。 使 用 标准 WO 函数 还 简化 了 对 输入 行 的 处 理 ( 常 
常 发 生 在 UNIX 的 应 用 程序 中 ) 。 例 如 ，fgets 函 数 读 取 一 个 完整 的 行 ， 
而 read 函 数 读 取 指 定 字 节 数 。 在 5.4 节 中 我 们 将 了 解 到 ， 标 准 IJO 函 数 库 
提供 了 使 我 们 能 够 控制 该 库 所 使 用 的 缓冲 风格 的 函数 。 

我 们 最 熟悉 的 标准 1/O 函 数 是 printf。 在 调用 printf 的 程序 中 ， 总 是 包 
含 <stdio.h> (在 本 书 中 ， 该 头 文 件 包含 在 apue.h 中 ) ， 访 头 文件 包括 了 
A aa 

SK 

图 1-5 程 序 的 功能 类 似 于 前 一 个 调用 了 read 和 write 的 程序 ，5.8 节 将 
对 此 程序 进行 更 详细 的 说 明 。 它 将 标准 输入 复制 到 标准 输出 ， 也 就 能 
制 任 一 UNIX 普 通 文 件 。 




















#include "apue ,hn 


int 
main (void) 
| 


int c? 


while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 
err sys("output error"); 


if (ferror (stdin) ) 
err sys("input error"); 


exit (0); 


图 1-5 用 标准 IO 将 标准 输入 复制 到 标准 输出 
函数 getc 一 次 读 取 一 个 字符 ， 然 后 函数 putc 将 此 字符 写 到 标准 和 输 
出 。 读 到 输入 的 最 后 一 个 字 节 时 ，getc 返 回 稼 量 EOF (该 常量 在 
<stdio.h> 中 定义 ) 。 标 准 IJO 常 量 stdin 和 stdout 也 在 头 文件 <stdio.h> 中 定 
义 ， 它 们 分 别 表示 标准 输入 和 标准 输出 。 





1.6 程序 和 进程 
1. 程序 


程序 (program) 是 一 个 存储 在 磁盘 上 某 个 目录 中 的 可 执行 文件 。 
内 核 使 用 exec 函 数 (7 个 exec 函 数 之 一 ) ， 将 程序 读 入 内 存 ， 并 执行 程 
序 。8.10 节 将 说 明 这 些 exec 函 数 。 

2. 进程 和 进程 ID 

程序 的 执行 实例 被 称 为 进程 Cprocess) 。 本 书 的 每 一 页 几乎 都 会 使 
用 这 一 术语 。 某 些 操作 系统 用 任务 〈task) 表示 正在 被 执行 的 程序 。 

UNIX 系 统 确保 每 个 进程 都 有 一 个 唯一 的 数字 标识 符 ， 称 为 进程 
ID (process ID) 。 进 程 一 总 是 一 个 非 负 整数 。 

实例 

图 1-6 程 序 用 于 打印 进程 ID。 





#include "apue.h" 


int 
main (void) 


| 
printf("hello world from process ID $ld\n", (long)getpid()); 


exit (0); 


图 1-6 打印 进程 ID 

如 果 将 该 程序 编译 成 a.out 文 件 ， 然 后 执行 它 ， 则 有 : 

$ ./a.out 

hello world from process ID 851 

$ ./a.out 

hello world from process ID 854 

此 程序 运行 时 ， 它 调用 函数 getpid 得 到 其 进程 ID。 我 们 将 会 在 后 
面 看 到 ，getpid 返回 一 个 pid_t 数 据 类 型 。 我 们 不 知道 它 的 大 小 ， 仅 知道 
的 是 标准 会 保证 它 能 保存 在 一 个 长 整 型 中 。 因 为 我 们 必须 在 printf 函 数 





中 指定 需要 打印 的 每 一 个 变量 的 大 小 ， 所 以 我 们 必须 把 它 的 值 强制 转换 
为 它 可 能 会 用 到 的 最 大 的 数据 类 型 (这 里 是 长 整 型 ) 。 虽 然 大 多 数 进 程 
ID 可 以 用 整 型 表示 ， 但 用 长 整 型 可 以 提高 可 移植 性 。 

3. 进程 控制 

有 3 个 用 于 进程 控制 的 主要 函数 : fork、exec 和 waitpid。 (exec 函 数 
oe 但 经 常 把 它们 统称 为 exec 函 数 。) 

SE fp 

UNIX 系 统 的 进程 控制 功能 可 以 用 一 个 简单 的 程序 说 明 〈 见 图 1- 
7) 。 该 程序 从 标准 输入 读 取 命令 ， 然 后 执行 这 些 命令 。 它 类 似 于 shell 
程序 的 基本 实施 部 分 。 





finclude "apue ,hn 
#include <sys/wait,h> 


int 

main (void) 

| 
char buf[MAXLINE]; /* from apue.h */ 
pidt pid; 
int status; 


printf ("3% ");  /* print prompt (printf requires %% to print %) */ 
while (fgets(buf, MAXLINE, stdin) != NULL) { 
if (buf[strlen (buf) - 1] == '\n') 
buf [strlen(buf) - 1] = 0; /* replace newline with null */ 


if ((pid = fork()) < 0) { 
err sys("fork error"); 

} else if (pid == 0) { /* child */ 
execlp(buf, buf, (char *)0); 
err ret ("couldn't execute: ss", buf); 
exit (127); 


/* parent */ 
if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waltpid error"); 
printf ("ss "); 
| 
exit (0); 


图 1-7 从 标准 输入 读 命 令 并 执行 
在 这 个 30 行 的 程序 中 ， 有 很 多 功能 需要 考虑 。 
“用 标准 IO 函数 fgets 从 标准 输入 一 次 读 取 一 行 。 当 键入 文件 结束 符 
《通常 是 Ctrl+D) 作为 行 的 第 一 个 字符 时 ，fgets 返回 一 个 nul 指针 ， 于 
是 循环 停止 ， 进 程 也 就 终止 。 第 ”18 章 将 说 明 所 有 特殊 的 终端 字符 CO 
件 结束 、 退 格 字符 、 整 行 探 除 等 ) ， 以 及 如 何 改变 它们 。 

“因为 fgets 返 回 的 每 一 行 都 以 换行 符 终 止 ， 后 随 一 个 null 字 节 ， 因 此 
用 标准 C 函 数 strlen 计 算 此 字符 串 的 长 度 ， 然 后 用 一 个 null 字 市 蔡 换 换行 
eee E 以 null 结 束 的 而 不 是 以 换行 符 

。 调 用 fork 创 建 一 个 新 进程 。 新 进程 是 调用 进程 的 一 个 副本 ， 我 们 称 
调用 进程 为 父 进程 ， 新 创建 的 进程 为 子 进 程 。fork 对 父 进 程 返回 新 的 子 
进程 的 进程 ID 〈 一 个 非 负 整数 ) ， 对 子 进 程 则 返回 0。 因 为 fork 创建 一 
个 新 进程 ， 所 以 说 它 被 调用 一 次 〈 由 父 进程 ) ， 但 返回 两 次 〈 分 别 在 父 
进程 中 和 在 子 进 程 中 ) 。 

“在 子 进程 中 ， 调 用 execlp 以 执行 从 标准 输入 读 入 的 命令 。 这 束 用 








新 的 程序 文件 人 蔡 换 了 子 进程 原先 执行 的 程序 文件 。fork 和 跟随 其 后 的 
exec 两 者 的 组 合 就 是 某 些 操作 系统 所 称 的 产生 (spawn) 一 个 新 进程 。 
在 UNIX 系 统 中 ， 这 两 部 分 分 离 成 两 个 独立 的 函数 。 第 8 章 将 对 这 些 函 数 
进行 更 多 说 明 。 

“ 子 进 程 调用 execlp 执行 新 程序 文件 ， 而 父 进程 希望 等 待 子 进 程 终 
止 ， 这 是 通过 调用 waitpid 实 现 的 ， 其 参数 指定 要 等 待 的 进程 〈( 即 pid 参 
数 是 子 进 程 ID) 。waitpid 函 数 返 回 子 进程 的 终止 状态 (status 变量 ) 。 
在 我 们 这 个 简单 的 程序 中 ， 没 有 使 用 该 值 。 

如 果 需 要 ， 可 以 用 此 值 准 确 地 判定 子 进程 是 如 何 终 止 的 。 

“该 程序 的 最 主要 限制 是 不 能 向 所 执行 的 命令 传递 参数 。 例 如 不 能 
站 定 要 列 出 目录 项 的 目录 名 ， 只 能 对 工作 目录 执行 ls 命令 。 为 了 传递 参 
数 ， 先 要 分 析 输 入 行 ， 然 后 用 某 种 约定 把 参数 分 开 ( 可 能 使 用 空格 或 制 
表 符 〉， 再 将 分 隔 后 的 各 个 参数 传递 给 execlp 函 数 。 尺 管 如 此 ， 此 程序 
仍 可 用 来 说 明 UNIX 系 统 的 进程 控制 功能 。 

如 果 运 行 此 程序 ， 将 得 到 下 列 结果 。 注 意 ， 访 程序 使 用 了 一 个 不 同 
的 提示 符 (%) ， 以 区 别 于 shell 的 提示 符 。 

$ ./a.out 

% date 

Sat Jan 21 19:42:07 EST 2012 

% who 

Sar console Jani 14:59 

Sar ttys000 9 Jani 14:59 

Sar ttys001 Jan 15 15:28 

% AD 键入 文件 结束 符 

$ 常规 的 shell 提 示 符 

% pwd 

/home/sar/bk/apue/3e 

% ls 

Makefile 

a.out 

Shell1.c 

AD 表示 一 个 控制 字符 。 控 制 字符 是 特殊 字符 ， 其 构成 方法 是 : 在 键 
盘 上 按 下 控制 键 一 一 通 销 被 标记 为 Control 或 Ctrl， 同 时 按 另 一 个 键 。 
Ctrl+D 或 AD 是 默认 的 文件 结束 符 。 在 第 18 章 中 讨论 终端 UO 时 ， 会 介绍 
更 多 的 控制 字符 。 

4. 线程 和 线程 ID 

通常 ， 一 个 进程 只 有 一 个 控制 线程 (thread) 一 某 一 时 刻 执行 的 一 




















组 机 器 指令 。 对 于 茶 些 问题 ， 如 果 有 多 个 控制 线程 分 别 作 用 于 它 的 不 同 
部 分 ， 那 么 解决 起 来 就 容易 得 多 。 另 外 ， 多 个 控制 线程 也 可 以 充分 利用 
多 处 理 右 系统 的 并 行 能 力 。 

一 个 进程 内 的 所 有 线程 共享 同一 地 址 空间 、 文 件 描述 符 、 栈 以 及 与 
进程 相关 的 属性 。 因 为 它们 能 访问 同一 存储 区 ， 所 以 各 线程 在 访问 共享 
数据 时 需要 采取 同步 措施 以 避免 不 一 致 性 。 

与 进程 相同 ， 线 程 也 用 ID 标识 。 但 是 ， 线 程 ID 只 在 它 所 属 的 进程 内 
起 作用 。 一 个 进程 中 的 线程 ID 在 另 一 个 进程 中 没有 意义 。 当 在 一 进程 
中 对 茶 个 特定 线程 进行 处 理 时 ， 我 们 可 以 使 用 该 线程 的 ID 引 用 它 。 

控制 线程 的 函数 与 控制 进程 的 函数 类 似 ， 但 力 有 一 套 。 线 程 模型 是 
在 进程 模型 建立 很 久之 后 才 被 引入 到 UNIX 系 统 中 的 ， 然 而 这 两 种 模型 
之 间 存 在 复杂 的 交互 ， 在 第 12 章 中 ， 我 们 会 对 此 进行 说 明 。 











1.7 出 和 馆 处 理 


当 UNIX 系 统 函 数 出 错时 ， 通 名 会 返回 一 个 负 值 ， 而 且 整 型 变量 
errno 通 常 被 设置 为 具有 特定 信息 的 值 。 例 如 ，open ”函数 如 果 成 功 执行 
则 返回 一 个 非 负 文件 描述 符 ， 如 出 错 则 返回 -1。 在 ”open 出 错时 ， 有 大 
约 15 种 不 同 的 ermo 值 (文件 不 存在 、 权 限 问 题 等 ) 。 而 有 些 函数 对 于 出 
普 则 使 用 另 一 种 约定 而 不 是 返回 负 值 。 例 如 ， 大 多 数 返 回 指 回 对 象 指 针 
的 函数 ， 在 出 错时 会 返回 一 个 null 指 针 。 

文件 <errno.h> 中 定义 了 errno 以 及 可 以 赋 与 它 的 各 种 常量。 这 些 常 量 
都 以 字符 E 开 头 。 另 外 ，UNIX 系 统 手 册 第 2 部 分 的 第 1 页 ，intro(2) 列 出 了 
所 有 这 些 出 错 和 常量 。 例 如 ， 知 errno 等 于 常量 EACCES， 表 示 产 生 了 权限 
问题 〈 例 如， 没有 足够 的 权限 打开 请 求 文件 ) 。 

在 Linux 中 ， 出 错 常 量 在 errno(3) 手 册页 中 列 出 。 

POSIX 和 ISO ”CC 将 errmo 定 义 为 一 个 符 写 ， 它 扩展 成 为 一 个 可 修改 的 
整形 左 值 (lvalue〉。 它 可 以 是 一 个 包含 出 错 编写 的 整数 ， 也 可 以 是 一 
个 返回 出 错 编号 指针 的 函数 。 以 前 使 用 的 定义 是 : 

extern int errno; 

但 是 在 文 持 线程 的 环境 中 ， 多 个 线程 共享 进程 地 址 空间 ， 每 个 线程 
都 有 属于 它 自 己 的 局 部 errno 以 避免 一 个 线程 干扰 另 一 个 线程 。 例 如 ， 
Linux 文 持 多 线程 存 取 errmo， 将 其 定义 为 : 

extern int *__errno_location(void); 

#define errno (*__errno_location()) 

对 于 ermo 应 当 注 意 两 条 规则 。 第 一 条 规则 是 : 如 果 没 有 出 错 ， 其 
值 不 会 被 例 程 清除 。 因 此 ， 仪 当 函 数 的 返回 值 指明 出 错时 ， 才 检验 其 
值 。 第 二 条 规则 是 : 任何 函数 都 不 会 将 errno ” 值 设置 为 0， 而 且 在 
<errno.h> 中 定义 的 所 有 常量 都 不 为 0。 

C 标 准 定 义 了 两 个 函数 ， 它 们 用 于 打印 出 错 信息 。 

#include <string.h> 

char *strerror(int ermum); 




















返回 值 ， 指 问 消 息 字符 串 的 指针 
strerrorel CK ermum 〈 通 党 就 是 errmno 值 ) 映射 为 一 个 出 错 消 息 字 符 
串 ， 并 且 返 回 此 字符 串 的 指针 。 
perror 函 数 基于 ermo 的 当前 值 ， 在 标准 错误 上 产生 一 条 出 错 消息 ， 
然后 返回 。 


#include <stdio.h> 

void perror(const char *msg); 

它 首 先 输 出 由 msg 指 向 的 字符 串 ， 然 后 是 一 个 冒号 ， 一 个 空格 ， 接 
着 是 对 应 于 errno 值 的 出 错 消 息 ， 最 后 是 一 个 换行 符 。 

实例 

图 1-8 程 序 显 示 了 这 两 个 出 错 函 数 的 使 用 方法 。 














finclude "apue, h" 
#include <errno.h> 


int 
main(int argc, char *argv[]) 
| 
fprintf(stderr, "EACCES; %s\n", strerror (EACCES) ); 
errno = ENOENT; 
perror (argv (0]); 
exit(0); 


图 1-8 例 示 strerror 和 perror 

如 果 将 此 程序 编译 成 文件 a.out， 然 后 执行 它 ， 则 有 

$ ./a.out 

EACCES: Permission denied 

/a.out: No such file or directory 

注意 ， 我 们 将 程序 名 〈argv[0]， 其 值 是 .ja.out) 作为 参数 传递 给 
perror。 这 是 一 个 标准 的 UNIX 惯 例 。 使 用 这 种 方法 ， 在 程序 作为 管道 的 
一 部 分 执行 时 ， 例 如 : 

prog1 < inputfile | prog2 | prog3 > outputfile 

我 们 惑 能 分 清 3 个 程序 中 的 哪 一 个 产生 了 一 条 特定 的 出 错 消 息 。 

本 书 中 的 所 有 实例 基本 上 都 不 直接 调用 strerror 或 perror， 而 是 使 用 
附录 B 中 的 出 错 函 数 。 该 附录 中 的 出 错 函 数 使 我 们 只 用 一 条 C 语 句 束 可 
利用 ISO C 的 可 变 参 数 表 功能 处 理 出 错 情 况 。 

出 错 恢复 

可 将 在 <errno.h> 中 定义 的 各 种 出 错 分 成 两 类 : 致命 性 的 和 非 致命 性 








的 。 对 于 致命 性 的 错误 ， 无 法 执行 恢复 动作 。 最 多 能 做 的 是 在 用 户 屏幕 
上 打印 出 一 条 出 错 消息 或 者 将 一 条 出 错 消息 写 入 日 志文 件 中 ， 然 后 退 
出 。 对 于 非 致命 性 的 出 错 ， 有 时 可 以 较 妥 善 地 进行 处 理 。 大 多 数 非 致命 
性 出 错 是 暂时 的 (如 资源 短缺 )， 当 系统 中 的 活动 较 少 时 ， 这 种 出 错 很 
可 能 不 会 发 生 。 

与 资源 相关 的 非 致命 性 出 错 包 括 : EAGAIN、ENFILE、 
ENOBUFS、ENOLCK、ENOSPC、EWOULDBLOCK， 有 时 ENOMEM 
也 是 非 致 命 性 出 错 。 当 EBUSY 指 明 共 享 资源 正在 使 用 时 ， 也 可 将 它 作 
为 非 致 命 性 出 错 处 理 。 当 EINTR 中 断 一 个 慢 速 系统 调用 时 ， 可 将 它 作 
为 非 致 命 性 出 错 处 理 〈 在 10.5 节 对 此 会 进行 更 多 说 明 ) 。 

对 于 资源 相关 的 非 致 命 性 出 错 的 典型 恢复 操作 是 延迟 一 段 时 间 ， 然 
后 重 试 。 这 种 技术 可 应 用 于 其 他 情况 。 例 如 ， 假 设 出 错 表 明 一 个 网 络 连 
接 不 再 起 作用 ， 那 么 应 用 程序 可 以 采用 这 种 方法 ， 在 短 时 间 延 人 运 后 ， 演 
试 重建 该 连接 。 一 些 应 用 使 用 指数 补偿 算法 ， 在 每 次 迭代 中 等 待 更 长 时 
间 。 

最 终 ， 由 应 用 的 开发 者 决定 在 哪些 情况 下 应 用 程序 可 以 从 出 错 中 恢 
复 。 如 果 能 够 采用 一 种 合理 的 恢复 策略 ， 那 么 可 以 避免 应 用 程序 异常 终 
止 ， 进 而 就 能 改善 应 用 程序 的 健壮 性 。 








1.8 H E ERIR 


1. 用 户 ID 

口令 文件 登录 项 中 的 用 户 ID (user ID) 是 一 个 数值 ， 它 向 系统 标识 
各 个 不 同 的 用 户 。 系 统管 理 员 在 确定 一 个 用 户 的 登录 名 的 同时 ， 确 定 其 
用 户 ID。 用 户 不 能 更 改 其 用 户 ID。 通 党 每 个 用 户 有 一 个 唯一 的 用 户 
A a 

HABE 

HF ID 为 0 的 用 户 为 根 用 户 Coot) 或 超级 用 户 (superuser) 。 在 
口令 文件 中 ， 通 党 有 一 个 登录 项 ， 其 登录 名 为 root， 我 们 称 这 种 用 户 的 
特权 为 超级 用 户 特 权 。 我 们 将 在 第 4 章 中 看 到 ， 如 果 一 个 进程 具有 超级 
用 户 特 权 ， 则 大 多 数 文 件 权 限 检 查 都 不 再 进行 。 某 些 操 作 系 统 功能 只 问 
超级 用 户 提 供 ， 超 级 用 户 对 系统 有 上 自由 的 文 配 权 。 

Mac OS X 客 户 端 版 本 交 由 用 户 使 用 时 ， 茜 用 超级 用 户 账户 ， 服 务 
器 版 本 则 可 使 用 该 账户 。 在 Apple 的 网 站 可 以 找到 使 用 说 明 ， 它 告知 如 
何 才能 使 用 该 账户 。 参 见 http://support.apple.com/kb/HT1528. 

2. 组 ID 

口令 文件 登录 项 也 包括 用 户 的 组 ID (group ID) ， 它 是 一 个 数值 。 
组 ID 也 是 由 系统 管理 员 在 指定 用 户 登 录 名 时 分 配 的 。 一 般 来 说 ， 在 口令 
文件 中 有 多 个 登录 项 具有 相同 的 组 ID。 组 被 用 于 将 知 干 用 户 集 合 到 项 
目 或 部 门 中 去 。 这 种 机 制 允许 同 组 的 各 个 成 员 之 间 共 享 资源 〈 如 文 
件 ) 。4.5 市 将 介绍 可 以 通过 设置 文件 的 权限 使 组 内 所 有 成 员 都 能 访问 
该 文件 ， 而 组 外 用 户 不 能 访问 。 

组 文件 将 组 名 映射 为 数值 的 组 ID。 组 文件 通常 是 /etc/group。 

使 用 数值 的 用 户 ID 和 数值 的 组 ID 设置 权限 是 历史 上 形成 的 。 对 于 厂 
盘 上 的 每 个 文件 ， 文 件 系统 都 存储 该 文件 所 有 者 的 用 户 ID 和 组 ID。 存 储 
这 两 个 值 只 需 4 个 字 市 (假定 每 个 都 以 双 字 节 的 整 型 值 存放 )〉 。 如 果 使 
用 完整 ASCII 登录 名 和 组 名 ， 则 需 更 多 的 磁盘 空间 。 另 外 ， 在 检验 权限 
期 间 ， 比 较 字 符 串 较 之 比较 整 型 数 更 消耗 时 间 。 

但 是 对 于 用 户 而 言 ， 使 用 名 字 比 使 用 数值 方便 ， 所 以 口令 文件 包含 
了 登录 名 和 用 户 ID 之 间 的 映射 关系 ， 而 组 文件 则 包含 了 组 名 和 组 ID 之 
间 的 映射 关系 。 例 如 ，1s -1 命令 使 用 口令 文件 将 数值 的 用 户 ID 映 射 为 登 
录 名 ， 从 而 打印 出 文件 所 有 者 的 登录 名 。 

早期 的 UNIX 系 统 使 用 16 位 整 型 数 表示 用 户 ID 和 组 ID。 现 今 的 UNIX 


























系统 使 用 32 位 整 型 数 表示 用 户 ID 和 组 ID。 
实例 
图 1-9 程 序 用 于 打印 用 户 ID 和 组 ID。 


tinclude "apue.h" 


int 

main (void) 

| 
printf ("vid = %d, gid = %d\n", getuid(), getgid()); 
exit (0); 


图 1-9 打印 用 户 ID 和 组 ID 
程序 调用 getuid 和 getgid 以 返回 用 户 ID 和 组 ID。 运 行 该 程序 的 结果 如 


$ ./a.out 

uid = 205, gid = 105 

3. 附属 组 ID 

除了 在 口令 文件 中 对 一 个 登录 名 指定 一 个 组 ID 外 ， 大 多 数 UNIX 系 
统 版 本 还 允许 一 个 用 户 属于 另外 一 些 组 。 这 一 功能 是 从 4.2BSD 开 始 的 ， 
它 允 许 一 个 用 户 属于 多 至 16 个 其 他 的 组 。 登 录 时 ， 读 文件 /etcgroup， 寻 
找 列 有 该 用 户 作为 其 成 员 的 前 16 个 记录 项 束 可 以 得 到 该 用 户 的 附属 组 
ID (supplementary group ID) 。 在 下 一 章 将 说 明 ，POSIX 要 求 系统 至 少 
应 文 持 8 个 附属 组 ， 实 际 上 大 多 数 系 统 至 少 文 持 16 个 附属 组 。 


信号 (signal) 用 于 通知 进程 发 生 了 某 种 情况 。 例 如 ， 若 某 一 进程 
执行 除法 操作 ， 其 除数 为 0， 则 将 名 为 SIGFPE 〈 浮 点 异常 ) 的 信号 发 送 
给 该 进程 。 进 程 有 以 下 3 种 处 理 信 号 的 方式 。 

(1) 忽略 信号 。 有 些 信号 表示 硬件 异常 ， 例 如 ， 除 以 0 或 访问 进程 
地 址 空间 以 外 的 存储 单元 等 ， 因 为 这 些 异 常 产 生 的 后 果 不 确定 ， 所 以 不 
推荐 使 用 这 种 处 理 方 式 。 
e (2) 按 系 统 默认 方式 处 理 。 对 于 除数 为 0， 系 统 默认 方式 是 终止 该 
进程 。 

(3) 提供 一 个 函数 ， 信 和 号 发 生 时 调用 该 函数 ， 这 被 称 为 捕捉 该 信 
号 。 通 过 提供 自 编 的 函数 ， 我 们 就 能 知道 什么 时 候 产 生 了 信号 ， 并 按期 
望 的 方式 处 理 它 。 

很 多 情况 都 会 产生 信号 。 终 端 键盘 上 有 两 种 产生 信号 的 方法 ， 分 别 
称 为 中 断 键 (interrupt key， 通常 是 Delete 键 或 Ctrl+C) 和 退出 键 (quit 
key, ÁF ECA) ， 它 们 被 用 于 中 断 当前 运行 的 进程 。 另 一 种 产生 售 
号 的 方法 是 调用 Kill 函数 。 在 一 个 进程 中 调用 此 函数 就 可 向 另 一 个 进程 
发 送 一 个 信号 。 当 然 这 样 做 也 有 些 限制 ， 当 疝 一 个 进程 发 送信 号 时 ， 我 
Le 的 所 有 者 或 者 是 超级 用 户 。 

SEB 

回忆 一 下 基本 的 shell 实 例 〈 见 图 1-7 程 序 ) 。 如 果 调 用 此 程序 ， 然 
后 按 下 中 断 键 ， 则 执行 此 程序 的 进程 终止 。 产 生 这 种 后 果 的 原因 是 : 对 
于 此 信号 (SIGINT) 的 系统 默认 动作 是 终止 进程 。 该 进程 没有 告诉 系 
统 内 核 应 该 如 何 处 理 此 信号 ， 所 以 系统 按 默认 方式 终止 该 进程 。 

为 了 能 捕捉 到 此 信号 ， 程 序 需要 调用 signal 函 数 ， 其 中 指定 了 当 产 
生 SIGINT 信 号 时 要 调用 的 孙 数 的 名 字 。 函 数 名 为 ”sig_int， 当 其 被 调用 
时 ， 只 是 打印 一 条 消息 ， 然 后 打印 一 个 新 提示 符 。 在 图 1-7 程 序 中 添加 
了 11 行 ， 构 成 了 图 1-10 程 序 〈 添 加 的 11 行 以 行 首 的 + 号 指示 ) 。 








#include "apue.h" 
#include <sys/wait.h> 


+ static void sig int(int); /* our signal-catching function */ 
+ 
int 
main (void) 
{ 
char buf [MAXLINE]; /* from apue.h */ 
pid t pid; 
int status; 


十 if (signal(SIGINT, sig int) == SIG ERR) 
+ err sys("signal error"); 


printf ("%% "); /* print prompt (printf requires %% to print %) */ 
while (fgets (buf, MAXLINE, stdin) != NULL) { 
if (buf[strlen(buf) - 1] == '\n') 
buf[strlen(buf) - 1] = 0; /* replace newline with null */ 


if ((pid = fork()) < 0) { 
err sys("fork error"); 

} else if (pid == 0) { /* child */ 
execlp(buf, buf, (char *)0); 
err ret("couldn't execute: %s", buf); 
exit (127); 


/* parent */ 
if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 
printf ("%% "); 
} 
exit (0); 


十 

+ void 

+ sig int (int signo) 
+ | 


+ printf("interrupt\ngs "); 


图 1-10 从 标准 输入 读 命令 并 执行 
因为 大 多 数 重要 的 应 用 程序 都 对 信号 进行 处 理 ， 所 以 第 10 章 将 详细 


1.10 HY [Be 


历史 上 ，UNIX 系 统 使 用 过 两 种 不 同 的 时 间 值 。 

(1) AGIA). tae BATE FLY (Coordinated Universal 
Time, UTC) 1970 年 1 月 1 日 00:00:00 这 个 特定 时 间 以 来 所 经 过 的 秒 数 累 
计 值 〈 早 期 的 手册 称 UTC 为 格林 尼 治 标准 时 间 ) 。 这 些 时 间 值 可 用 于 记 
录 文 件 最 近 一 次 的 修改 时 间 等 。 

系统 基本 数据 类 型 time_t 用 于 保存 这 种 时 间 值 。 

(2) 进程 时 间 。 也 被 称 为 CPU 时 间 ， 用 以 度量 进程 使 用 的 中 央 处 
a a 
时 钟 滴答 。 

系统 基本 数据 类 型 clock t 保 存 这 种 时 间 值 。2.5.4 节 将 说 明 如 何 用 
sysconf 函 数 得 到 每 秒 的 时 钟 滴答 数 。 

当 度 量 一 个 进程 的 执行 时 间 时 《〈 见 3.9 节 ) ，UNIX 系 统 为 一 个 进程 
维护 了 3 个 进程 时 间 值 : 

时钟 时 间 ; 

用户 CPU 时 间 ; 

系统 CPU 时 间 。 

时 钟 时 间 又 称 为 墙 上 时 钟 时 间 (wall clock time) ， 它 是 进程 运行 的 
时 间 总 量 ， 其 值 与 系统 中 同时 运行 的 进程 数 有 关 。 每 当 在 本 书 中 提 到 时 
钟 时 间 时 ， 都 是 在 系统 中 没有 其 他 活动 时 进行 度量 的 。 

用 户 CPU 时 间 是 执行 用 户 指令 所 用 的 时 间 量 。 系 统 CPU 时 间 是 为 该 
进程 执行 内 核 程序 所 经 历 的 时 间 。 例 如 ， 每 当 一 个 进程 执行 一 个 系统 服 
务 时 ， 如 read 或 write， 在 内 核 内 执行 该 服务 所 花费 的 时 间 就 计 入 该 进程 
的 系统 CPU 时 间 。 用 户 CPU 时 间 和 系统 CPU 时 间 之 和 常 被 称 为 CPU 时 
间 。 

要 取得 任 一 进程 的 时 钟 时 间 、 用 户 时 间 和 系统 时 间 是 很 容易 的 一 只 
要 执行 命令 time(1)， 其 参数 是 要 度量 其 执行 时 间 的 命令 ， 例 如 ; 

$ cd /usr/include 

$ time -p grep _POSIX_SOURCE */*.h > /dev/null 

real om0.81s 

user om0.11s 

sys om0.07s 


time 命 令 的 输出 格式 与 所 使 用 的 shell 有 关 ， 其 原因 是 某 些 shell 并 不 





运行 /usr/bin/time， 而 是 使 用 一 个 内 置 函数 测量 命令 运行 所 使 用 的 时 间 。 
8.17 节 将 说 明 一 个 运行 进程 如 何 取得 这 3 个 时 间 。 关 于 时 间 和 日 期 
的 一 般 说 明 见 6.10 节 。 








所 有 的 操作 系统 都 提供 多 种 服务 的 入 口 点 ， 由 此 程序 向 内 核 请 求 服 
务 。 各 种 版 本 的 UNIX 实 现 都 提供 良好 定义 、 数 量 有 限 、 直 接 进 入 内 核 
的 入 口 点 ， 这 些 入 口 点 被 称 为 系统 调用 (system call， 见 图 1-1) 。 
Research UNIX 系 统 第 7 版 提供 了 约 50 个 系统 调用 ，4.4BSD 提 供 了 约 110 
个 系统 调用 ， 而 SVR4 则 提供 了 约 120 个 系统 调用 。 具 体 数 字 在 不 同 操作 
系统 版 本 中 会 不 同 ， 新 近 的 大 多 数 系统 大 大 增加 了 支持 的 系统 调用 的 个 
数 。Linux 3.2.0 提 供 了 380 个 系统 调用 ，FreeBSD 8.0 提 供 的 系统 调用 超 
过 450 个 。 

系统 调用 接口 总 是 在 《UNIX 程 序 员 手 册 》 的 第 2 部 分 中 说 明 ， 是 用 
C 语 言 定义 的 ， 与 具体 系统 如 何 调用 一 个 系统 调用 的 实现 技术 无 关 。 这 
与 很 多 早期 的 操作 系统 不 同 ， 那 些 系统 按 传统 方式 用 机 器 的 汇编 语言 定 
义 内 核 入 口 点 。 

UNIX 所 使 用 的 技术 是 为 每 个 系统 调用 在 标准 C 库 中 设置 一 个 具有 同 
样 名 字 的 函数 。 用 户 进 程 用 标准 C 调 用 序列 来 调用 这 些 函 数 ， 然 后 ， 函 
数 又 用 系统 所 要 求 的 技术 调用 相应 的 内 核 服务 。 例 如 ， 函 数 可 将 一 个 或 
多 个 C 参 数 送 入 通用 寄存 器 ， 然 后 执行 某 个 产生 软 中 断 进 入 内 核 的 机 器 
指令 。 从 应 用 角度 考虑 ， 可 将 系统 调用 视 为 C 函 数 。 

《UNIX 程 序 员 手 册 》 的 第 3 部 分 定义 了 程序 员 可 以 使 用 的 通用 库 也 
数 。 虽 然 这 些 函 数 可 能 会 调用 一 个 或 多 个 内 核 的 系统 调用 ， 但 是 它们 并 
不 是 内 核 的 入 口 点 。 例 如 ，printf 函数 会 调用 write 系统 调用 以 输出 一 个 
字符 串 ， 但 函数 strcpy〈 复 制 一 个 字符 串 〉 和 atoi (将 ASCII 转 换 为 整 
数 ) 并 不 使 用 任何 内 核 的 系统 调用 。 

从 实现 者 的 角度 来 看 ， 系 统 调用 和 库 函 数 之 间 有 根本 的 区 别 ， 但 从 
用 户 角度 来 看 ， 其 区 别 并 不 重要 。 在 本 书 中 ， 系 统 调 用 和 库 函 数 都 以 C 
函数 的 形式 出 现 ， 两 者 都 为 应 用 程序 提供 服务 。 但 是 ， 我 们 应 当 理 解 ， 
0 


以 存储 空间 分 配 函 数 malloc 为 例 。 有 多 种 方法 可 以 进行 存储 空间 分 
配 及 与 其 相关 的 无 用 空间 回收 操作 《最 佳 适 应 、 首 次 适应 等 ) ， 并 不 存 
在 对 所 有 程序 都 最 优 的 一 种 技术 。UNIX 系 统 调用 中 处 理 存 储 空 间 分 配 
的 是 sbrk(2)， 它 不 是 一 个 通用 的 存储 器 管理 器 。 它 按 指 定 字 节 数 增加 或 
减少 进程 地 址 空间 。 如 何 管 理 该 地 址 空间 却 取 诀 于 进程 。 存 储 空间 分 配 














函数 malloc(3) 实 现 一 种 特定 类 型 的 分 配 。 如 果 我 们 不 喜欢 其 操作 方式 ， 
则 可 以 定义 上 自己 的 malloc 函 数 ， 它 很 可 能 将 使 用 sbrk ”系统 调用 。 事 实 
上 ， 有 很 多 软件 包 ， 它 们 使 用 sbrk 系统 调用 实现 自己 的 存储 空间 分 配 
算法 。 图 1-11 显 示 了 应 用 程序 、malloc 函 数 以 及 sbrk 系 统 调用 之 间 的 关 


从 中 可 见 ， 两 者 职责 不 同 ， 内 核 中 的 系统 调用 分 配 一 块 空 间 给 进 
程 ， 而 库 函 数 malloc 则 在 用 户 层 次 管理 这 一 空间 。 

另 一 个 可 说 明 系 统 调 用 和 库 函 数 之 间 差 别 的 例子 是 ，UNIX 系统 提 
供 的 判断 当前 时 间 和 日 期 的 接口 。 一 些 操作 系统 分 别提 供 了 一 个 返回 时 
间 的 系统 调用 和 另 一 个 返回 日 期 的 系统 调用 。 任 何 特殊 的 处 理 ， 例 如 正 
和 时 制 和 夏令 时 之 间 的 转换 ， 由 内 核 处 理 或 要 求人 为 干预 。UNIX 系统 
则 不 同 ， 它 只 提供 一 个 系统 调用 ， 该 系统 调用 返回 自 协调 世界 时 1970 年 
1 月 1 日 零 时 这 个 特定 时 间 以 来 所 经 过 的 秒 数 。 对 该 值 的 任何 解释 ， 例 如 
将 其 变换 成 人 们 可 读 的 、 适 用 于 本 地 时 区 的 时 间 和 日 期 ， 都 留 给 用 户 进 
程 进行 处 理 。 在 标准 C 库 中 ， 提 供 了 若干 例 程 以 处 理 大 多 数 情况 。 这 些 
库 函 数 处 理 各 种 细节 ， 如 各 种 夏令 时 算法 等 。 

应 用 程序 既 可 以 调用 系统 调用 也 可 以 调用 库 函 数 。 很 多 库 函 数 则 会 
调用 系统 调用 。 图 1-12 显 示 了 这 种 差别 。 
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图 1-12 C 库 函数 和 系统 调用 之 间 的 差别 
系统 调用 和 库 了 水 数 之 间 的 男 一 个 差别 是 : 系统 调用 通常 提供 一 种 最 
小 接口 ， 而 库 函 数 通 常 提供 比较 复杂 的 功能 。 我 们 从 sbtk 系 统 调 用 和 
malloc 库 函数 之 间 的 差别 中 可 以 看 到 这 一 点 。 当 我 们 比较 不 带 绥 冲 的 IO 
函数 〈 见 第 3 章 ) 和 标准 IO 函数 〈 见 第 5 章 ) 时 ， 还 将 看 到 这 种 差别 。 
进程 控制 系统 调用 (fork. exec 和 wait) 通常 由 用 户 应 用 程序 直接 








调用 (请 回忆 图 1-7 中 的 基本 shell) 。 但 是 为 了 简化 某 些 常见 的 情况 ， 
UNIX “系统 也 提供 了 一 些 库 函 数 ， 如 system 和 popen。8.13 节 将 说 明 
System 函数 的 一 种 实现 ， 它 使 用 基本 的 进程 控制 系统 调用 。10.18 节 还 将 


强化 这 一 实例 以 正确 地 处 理 信和 号。 

为 使 读者 了 解 大 多 数 程序 员 应 用 的 UNIX 系 统 接口 ， 我 们 不 得 不 既 
说 明 系 统 调用 ， 又 介绍 某 些 库 函 数 。 例 如 ， 若 只 描述 sbrk 系 统 调用 ， 那 
么 就 会 忽略 很 多 应 用 程序 使 用 的 malloc 库 函数 。 本 书 除了 必须 要 区 分 两 
者 时 ， 对 系统 调用 和 库 函 数 都 使 用 图 数 (function) 这 一 术语 来 表示 。 


1.12 小 结 


本 章 快 速 浏 览 YUNIX 系 统 。 说 明了 东 些 以 后 会 多 次 用 到 的 基本 术 
语 ， 介 绍 了 一 些小 的 UNIX 程 序 实例 。 读 者 可 以 从 中 大 概 了 解 到 本 书 其 
余部 分 将 要 介绍 的 内 容 。 

下 一 章 是 关于 UNIX 系 统 的 标准 ， 以 及 这 方面 的 工作 对 当前 系统 的 
影响 。 标 准 ， 特 别 是 ISO ” C 标 准 和 POSIX.1 标 准 ， 将 影响 本 书 的 余下 部 


as 


习题 


1.1 在 系统 上 验证 ， 除 根 目 录 外 ， 目 录 . 和 .. 是 不 同 的 。 
1.2 分 析 图 1-6 程 序 的 输出 ， 说 明 进 程 ID 为 852 和 853 的 进程 发 生 了 什 

么 情况 ? 

1.3 ”在 1.7 节 中 ，perror 的 参数 是 用 ISO  C 的 属性 const 定 义 的 ， 而 
strerror 的 整 型 参数 没有 用 此 属性 定义 ， 为 什么 ? 

1.4 若 日 历时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 那 么 到 哪 一 年 它 将 
Vi HH? 可 以 用 什么 方法 扩展 溢出 浮 点 数 ? 采用 的 策略 是 否 与 现 有 的 应 用 
相 兼 容 ? 

1.5 若 进 程 时 间 存 放 在 带 符 号 的 32 位 整 型 数 中 ， 而 且 每 秒 为 100 时 钟 
滴答 ， 那 么 经 过 多 少 天 后 该 时 间 值 将 会 溢出 ? 














Qe UNIX 标 准 及 实现 


2155 


人 们 在 UNIX 编 程 环 境 和 C 程 序 设计 语言 的 标准 化 方面 已 经 做 了 很 多 
工作 。 虽 然 UNIX 应 用 程序 在 不 同 的 UNIX 操 作 系 统 版 本 之 间 进 行 移植 相 
当 容 易 ， 但 是 20 世 纪 80 年 代 UNIX 版 本 种 类 的 剧 增 以 及 它们 之 间 差 别 的 
扩大 ， 导 致 很 多 大 用 户 〈 如 美国 政府 ) 呼吁 对 其 进行 标准 化 。 

本 章 首 先 回顾 过 去 近 25 年 人 们 在 UNIX 标准 化 方面 做 出 的 种 种 努 
力 ， 然 后 讨论 这 些 UNIX 编程 标准 对 本 书 所 列举 的 各 种 UNIX 操 作 系 统 
实现 的 影响 。 所 有 标准 化 工作 的 一 个 重要 部 分 是 对 每 种 实现 必须 定义 的 
限制 进行 说 明 ， 所 以 我 们 将 说 明 这 些 限制 以 及 确定 它们 值 的 各 种 方 
法 。 

















2.2 UNIX 标 准 化 


2.2.1 ISO C 


1989 年 下 半年 ，C 程 序 设 计 语 言 的 ANSI 标 准 X3.159-1989 得 到 批 
准 。 此 标准 被 也 采纳 为 国际 标准 ISO/IEC ”9899:1990。ANSI 是 美国 国家 
标准 学 会 (American National Standards Institute) 的 缩写 ， 它 是 国际 标 
准 化 组 织 (International Organization for Standardization, ISO) 中 代表 美 
的 成 员 。IEC 是 国际 电子 技术 委员 会 (International Electrotechnical 
Commission) 的 缩写 。 

ISO C 标 准 现在 由 ISO/EC 的 C 程 序 设计 语言 国际 标准 工作 组 维护 和 
开发 ， 该 工作 组 称 为 I SO/IEC JTC1/SC22/WG14， 简 称 WG14. ISO CER 
准 的 意图 是 提供 C 程 序 的 可 移植 性 ， 使 其 能 适合 于 大 量 不 同 的 操作 系 
统 ， 而 不 只 是 适合 UNIX 系 统 。 此 标准 不 仅 定 义 了 C 程 序 设计 语言 的 语法 
和 语义 ， 还 定义 了 其 标准 库 (参见 ISO 1999 第 7 章 ; Plauger[1992]; 
Kernighan 和 Ritchie[1988] 中 的 附录 B) 。 因 为 所 有 现今 的 UNIX 系 统 《〈 如 
本 书 介绍 的 几 个 UNIX 系 统 ) 都 提供 C 标 准 中 定义 的 库 函 数 ， 所 以 该 标准 
库 非 常 重要 。 

1999 年 ，ISO_C 标 准 被 更 新 ， 并 被 批准 为 ISO/IEC 9899:1999, ‘Ewe 
著 改 善 了 对 进行 数值 处 理 的 应 用 软件 的 文 持 。 除 了 对 某 些 函数 原型 增加 
了 关键 字 restrict 外 ， 这 种 改变 并 不 影响 本 书 中 描述 的 POSIX 接 口 。 
restrict 关 键 字 告诉 编译 器 ， 哪 些 指针 引用 是 可 以 优化 的 ， 其 方法 是 指出 
指针 引用 的 对 象 在 函数 中 只 通过 该 指针 进行 访问 。 

1999 年 以 来 ， 己 经 公布 了 3 个 技术 勘误 来 修正 ISO C 标 准 中 的 错误 ， 
分 别 在 2001 年 、2004 年 和 2007 年 公布 。 如 同 大 多 数 标准 一 样 ， 在 批准 
标准 和 修改 软件 使 其 符合 标准 两 者 之 间 有 一 段 时 间 延 迟 。 随 着 供应 商 编 
译 系统 的 不 断 演 化 ， 对 最 新 ISO C 标 准 的 支持 也 就 越 来 越 多 。 

gcc 对 ISO C 标 准 1999 版 本 符合 程度 的 总 结 可 参见 
http://www.gnu.org/c99status. html1， 虽 然 C 标 准 已 经 在 2011 年 更 新 ， 但 由 
人 因此 在 本 书 中 我 们 还 是 沿用 1999 年 
和 J 版 本 。 

按照 该 标准 定义 的 各 个 头 文件 〈 见 图 2-1) 可 将 ISO ”CC 库 分 成 24 个 
区 。POSIX.1 标 准 包 括 这 些 头 文件 以 及 另外 一 些 头 文件 。 从 网 2-1 中 可 以 
看 出 ， 所 有 这 些 头 文件 在 4 种 UNIX 实 现 (FreeBSD 8.0、Linux 3.2.0, 








Mac OS X 10.6.8 和 Solaris 10) 中 都 文 持 。 本 章 后 面 将 对 这 4 种 UNIX 实 现 
进行 说 明 。 

ISO  C 尖 文件 依赖 于 操作 系统 所 配置 的 C 编 译 器 的 版 本 。FreeBSD 
8.0 配 置 了 gcc 4.2.1 版 ， Solaris 10 配 置 了 gcc 3.4.3 版 (以 及 Sun Studio H 
带 的 C 编 译 器 ) ，Ubuntu 12.04 (Linux 3.2.0) 配置 了 gcc 4.6.3 版 ，Mac 
OS X 10.6.8 配 置 了 gcc 4.0.1 和 4.2.1 版 。 


头 文件 FreeBSD 8.0 Linux 3.2.0 MacOSX 10.6.8 Solaris 10 
(ss ss SSS ae 


<assert.h> 
<complex.h> 
<ctype.h> 
《errno,h> 
<fenv. h> 
<float.h> 
<inttypes.h> 
<180646.h> 
<limits.h> 
<locale.h> 
<math. h> 
<set jmp, h> 
<signal,h> 
<stdarg.h> 
<stdbool.h> 
<stddef .h> 
<stdint.h> 
<stdio.h> 
<stdlib.h> 
<string.h> 
<tgmath,h> 
<time ,h> 
<WChar ,h> 


<wctype. h> 
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图 2-1 ISO C 标 准 定义 的 头 文件 
2.2.2 IEEE POSIX 


POSIX 是 一 个 最 初 由 IEEE (Institute of Electrical and Electronics 
Engineers， 电 气 和 电子 工程 师 学 会 ) 制订 的 标准 族 。POSIX 指 的 是 可 移 
植 操 作 系 统 接口 (Portable Operating System Interface) 。 它 原来 指 的 只 
是 IEEE 标 准 1003.1-1988 (操作 系统 接口 ) ， 后 来 则 扩展 成 包括 很 多 标 
记 为 1003 的 标准 及 标准 草案 ， 如 shell 和 实用 程序 (1003.2) 。 

与 本 书 相 关 的 是 1003.1 操 作 系 统 接口 标准 ， 该 标准 的 目的 是 提升 应 
用 程序 在 各 种 UNIX 系 统 环境 之 间 的 可 移植 性 。 它 定义 了 “符合 POSIX 
的 ”(POSIX compliant) 操作 系统 必须 提供 的 各 种 服务 。 该 标准 已 被 很 
多 计算 机 制造 商 采 用 。 虽 然 1003.1 标 准 是 以 UNIX 操 作 系 统 为 基础 的 ， 

但 是 它 并 不 限于 UNIX 和 UNIX 类 的 系统 。 确 实 ， 有 些 提 供 专 有 操作 系统 
的 制造 商 也 声称 他 们 的 系统 符合 POSIX (同时 还 保留 所 有 专 有 功能 

由 于 1003.1 标准 说 明了 一 个 接口 Cinterface) 而 不 是 一 种 实现 
(implementation) ， 所 以 并 不 区 分 系统 调用 和 库 函 数 。 所 有 在 标准 中 
的 例 程 都 被 称 为 函数 。 

标准 是 不 断 演进 的 ，1003.1 标 准 也 不 例外 。 该 标准 的 1988 版 ， 即 
IEEE 标 准 1003.1-1988 经 修改 后 递交 给 ”ISO， 它 没有 增加 新 的 接口 或 功 
能 ， 但 修订 了 文本 。 最 终 的 文档 作为 IEEE 标准 1003.1-1990 正式 出 版 
[IEEE 1990]， 这 也 就 是 国际 标准 ISO/IEC 9945-1:1990。 该 标准 通常 称 头 
POSIX.1， 本 书 将 使 用 此 术语 来 表示 不 同 版 本 的 标准 。 

IEEE 1003.1 工 作 组 此 后 继续 对 这 一 标准 做 了 更 多 修改 。1996 年 ， 该 
标准 的 修订 版 发 布 ， 它 包括 了 1003.1-1990、1003.1b-1993 实 时 扩展 标准 
以 及 被 称 为 pthreads 的 多 线程 编程 接口 (POSIX 线 程 ) ， 这 就 是 国际 标 
准 ISO/IEC 9945-1:1996。1999 年 出 版 了 IEEE 标 准 1003.1d-1999， 其 中 增 
加 了 更 多 实时 接口 。 一 年 后 ， 出 版 了 IEEE 标 准 1003.1j-2000 和 1003.1q- 
2000， 前 者 包含 了 更 多 实时 接口 ， 后 者 增加 了 标准 在 事件 跟踪 方面 的 扩 
展 。 

2001 年 的 1003.1 版 本 与 以 前 各 版 本 有 较 大 的 差别 ， 它 组 合 了 多 个 
1003.1 的 修正 、1003.2 标 准 以 及 Single UNIX Specificaiton (SUS) 第 2 版 
的 若干 部 分 (对 于 SUS， 后 面 将 进行 更 多 说 明 ) ， 这 形成 了 IEEE 标 准 
1003.1-2001， 它 包括 下 列 几 个 标准 。 

‘ISO/IEC 9945-1 (IEEE 标 准 1003.1-1996) ， 包 括 

4IEEE 标 准 1003.1-1990 

$IEEE 标 准 1003.1b-1993 (实时 扩展 ) 











$IEEE 标 准 1003.1c-1995 (pthreads ) 

$IEEE 标 准 1003.1i-1995 (实时 技术 勘误 表 ) 

“IEEE P1003.1a 草 案 ( 系 统 接口 修正 ) 

eTEEE 标 准 1003.1d-1999 (高 级 实时 扩展 ) 

TEEE 标 准 1003.1j-2000 (更 多 高 级 实时 扩展 ) 

IEEE 标 准 1003.1g-2000 (跟踪 ) 

“部 分 IEEE 标 准 1003.1g-2000 (协议 无 关 接口 ) 

*ISO/IEC 9945-2 (IEEE 标 准 1003.2-1993) 

‘IEEE P1003.2b 草 案 (shell 及 实用 程序 的 修正 ) 

eTEEE 标 准 1003.2d-1994( 批 处 理 扩展 ) 

“Single UNIX Specification 第 2 版 基本 说 明 ， 包 括 

4 系统 接口 定义 ， 第 5 发 行 版 

4 命令 和 实用 程序 ， 第 5 发 行 版 

4 系统 接口 和 头 文 件 ， 第 5 发 行 版 

* 开 放 组 技术 标准 ， 网 络 服务 ，5.2 发 行 版 

*ISO/IEC 9899-1999，C 程 序 设计 语言 

2004 年 ，POSIX.1 说 明 随 着 技术 勘误 得 到 更 新 ，2008 年 做 了 更 多 综 
合 的 改动 并 作为 基本 说 明 的 第 7 RITRAE, ISO 在 2008 年 底 批准 了 
这 个 版 本 并 在 2009 年 进行 发 布 ， 即 国际 标准 ISO/IEC9945:2009。 该 标 
准 基 于 其 他 几 个 标准 。 

eTEEE 标 准 1003.1，2004 年 版 。 

。 开 放 组 织 技术 标准 ，2006， 扩 展 API 集 ， 第 1 一 4 部 分 。 

。ISO/IEC 9899:1999， 包 含 勘误 表 。 

图 2-2、 图 2-3 以 及 图 2-4 总 结 了 POSIX.1 指 定 的 必需 的 和 可 选 的 头 文 
件 。 因 为 POSIX.1 包 含 了 ISO C 标 准 库 函数 ， 所 以 它 还 需要 图 2-1 中 列 出 
的 各 个 头 文件 。 这 4 张 图 中 的 表 也 总 结 了 本 书 所 讨论 的 4 种 UNIX 系 统 实 
现 所 包含 的 头 文件 。 
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<aio.h> 异步 VO 

<cpio.h> cpio 归档 值 
<dirent.h> 目录 项 (4.22 节 ) 
<dlfcn.h> 动态 链接 

<fentl.h> 文件 控制 (3.14 节 》 
<fnmatch.h> 文件 名 匹配 类 型 
<glob.h> 路 径 名 模式 匹配 与 生成 
<grp.h> 组 文件 (6.4 节 ) 
<iconv.h> 代码 集 变 换 实 用 程序 
<langinfo.h> 语言 信息 常量 
<monetary.h> 货币 类 型 与 函数 
<netdb.h> 网 络 数据 库 操作 
<nl_types.h> 消息 类 

<poll.h> 投票 函数 〈14.4.2 节 ) 
<pthread.h> 线程 (11 章 、 第 12 章 ) 
<pwd.h> 口令 文件 6.24) 
<regex.h> 正则 表达 式 

<sched.h> 执行 调度 
<semaphore.h> 信号 量 

<strings.h> 字符 串 操作 

<tar.h> tar 归档 值 
<termios.h> 终端 IJO (第 18 章 ) 
<unistd.h> 符号 常量 

<wordexp.h> 字 扩 充 类 型 
<arpa/inet.h> 因特网 定义 〈 第 16 章 ) 
<net/if.h> 套 接 字 本 地 接口 (第 16 章 ) 
<netinet/in.h> 因特网 地 址 族 (16.3 节 ) 
<netinet/tcp.h> 传输 控制 协议 定义 
<sys/mman.h> 存储 管理 声明 
<sys/select.h> select AM (14.4.1 43) 
<sys/socket.h> 套 接 字 接口 〈 第 16 章 ) 
<sys/stat.h> 文件 状态 〈 第 4 章 ) 
<sys/statvfs.h> 文件 系统 信息 
<sys/times.h> 进程 时 间 (8.17 49) 
<sys/types.h> 基本 系统 数据 类 型 (2.8 节 ) 
<sys/un.h> UNIX 域 套 接 字 定义 (17.2 节 ) 
<sys/utsname.h> 系统 名 (6.9 节 ) 
<sys/wait.h> 进程 控制 (8.6 节 ) 





图 2-2 POSIX 标 准 定 义 的 必需 的 头 文件 
本 书 中 描述 了 POSIX.1 2008 年 版 ， 其 接口 分 成 两 部 分 : 必需 部 分 和 
可 选 部 分 。 可 选 接口 部 分 按 功 能 又 进一步 分 成 40 个 功能 分 区 。 图 2-5 按 
各 目的 选项 码 总 结 了 包含 未 弃 用 的 编程 接口 。 选 项 码 是 能 够 表述 标准 的 
2~3 ”个 字母 的 缩写 ， 用 以 标识 属于 各 个 功能 分 区 的 接口 ， 其 中 的 接口 
依赖 于 特定 选项 的 支持。 很 多 选项 处 理 实时 扩展 。 
FreeBSD Linux MacOSX 
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<fmtmsg.h> 

<ftw.h> 

<libgen.h> 路 径 名 管理 函数 

<ndbm, h> 数据 库 操作 

《Search,h> 搜索 表 

<syslog.h> 系统 出 错 日 志 记 录 (1341) 


<utmpx. h> 用 户 账户 数据 座 


<sys/ipc.h> IPC (15.6 4) 
<sys/msg.h> XS 消息 队列 (15.7 节 ) 
<sys/resource.h> RIE (7.11) 
<sys/sem.h> XSI 信 号 量 (15.8 节 ) 
<sys/shm.h> XS[ 共 享 存储 (15.9 i) 
<sys/time.h> 时 间 类 型 
<sys/uio.h> ki NO 操作 (14.6 i) 





图 2-3 POSIX 标 准 定 义 的 XSI 可 选 头 文件 
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<mqueue, eee | | 队列 
<spawn .h> 实时 spawn 接口 


图 2-4 POSIX 标 准 定义 的 可 选 头 文件 


TI | ADVISORY_INFO tee Ga) SSCS (实时 ) 
_POSIX CPUTIME 进程 CPU 时间 时 钟 (实时 ) 
POSIX FSYNC 文件 同步 
POSIX IPV6 Pw 接口 
_POSIX MEMLOCK 进程 存储 区 加 锁 ( 
_POSIX MEMLOCK RANGE 存储 区 域 加 锁 ( 实 
POSIX MONOTONIC CLOCK 单调 时 钟 (实时 ) 
_POSIX MESSAGE. PASSING 消息 传送 (实时 ) 
_ _STDC_IEC_559__ TEC 60559 浮 点 选项 

POSIX PRIORITIZED I0 优先 输入 和 输出 
_POSIX_PRIORITIZ2ED SCHEDULING | 进程 调度 (实时 ) 

POSIX THREAD ROBUST_PRIO INHERIT | 健壮 的 互 斥 量 优先 权 继承 (实时 ) 
POSIX THREAD ROBUST PRIO PROTECT | 健壮 的 互 斥 量 优先 权 保护 (SEIN) 
_POSIX RAW SOCKETS Win Bey 

POSIX SHARED MEMORY OBJECTS 共享 存储 对 象 (实时 
POSIX SYNCHRONIZED 10 同步 输入 和 输出 (5 
_POSIX SPAIN 产生 (实时 ) 
_POSIX SPORADIC SERVER 进程 阵 发 性 服务 器 (实时 ) 
POSIX THREAD. CPUTIME 线程 CPU 时 间 时 钟 (实时 ) 


实时 ) 
时 ) 








) 
KM) 





IX THREAD PRIO_INHERIT 
IX THREAD PRIO PROTECT 
IX THREAD PRIORITY SCHEDULING | 线程 
POSIX THREAD ATTR STACKADDR 线程 栈 地 址 属性 








POSIX THREAD SPORADIC SERVER | 线程 阵 发 性 服务 器 (实时 ) 
POSIX THREAD ATTR STACKSI2E 线程 栈 长 度 属性 

POSIX TYPED MEMORY OBJECTS RAEN (SER) 
_XOPEN UNIX X/Open 扩充 接口 





x 
POSIX THREAD PROCESS SHARED 线程 进程 共享 同步 
X_ 
x 




















图 2-5 POSIX.1 可 选 接 口 组 和 选项 码 

POSIX.1 没有 包括 超级 用 户 (superuser) 这 样 的 概念 ， 代 之 以 规定 
某 些 操 作 要 求 “ 适 当 的 优先 权 ”，POSIX.1 将 此 术语 的 含义 留 由 具体 实现 
进行 解释 。 某 些 符 合 美国 国防 部 安全 性 指 璀 要求 的 UNIX 系 统 具 有 很 多 
T 本 书 仍 使 用 传统 的 UNIX 术 语 ， 并 指明 要 求 超级 用 户 特 
流 的 操作 。 

经 过 20 多 年 的 工作 ， 相 关 标 准 已 经 成 熟 稳定 。POSIX.1 标 准 现在 由 
Austin Group 开 放 工 作 组 (http://www.opengroup.org/austin) 维护 。 为 了 
保证 它们 仍然 有 价值 ， 仍 需 经 常 对 这 些 标准 进行 更 新 或 再 确认 。 





2.2.3 Single UNIX Specification 


Single UNIX Specification (SUS， 单 一 UNIX 规 范 ) 是 POSIX.1 标 准 
的 一 个 超 集 ， 它 定义 了 一 些 附加 接口 扩展 了 POSIX.1 规 范 提供 的 功能 。 
POSIX.1 相 当 于 Single UNIX Specification 中 的 基本 规范 部 分 。 

POSIX.1 中 的 X/Open 系统 接口 (X/Open System Interface, XSI) 选 
项 描述 了 可 选 的 接口 ， 也 定义 了 遵循 XSI〈XSI conforming) 的 实现 必须 
支持 POSIX.1 的 哪些 可 选 部 分 。 这 些 必 须 支 持 的 部 分 包括 : 文件 同步 、 
线程 栈 地 址 和 长 度 属性 、 线 程 进程 共享 同步 以 及 _XOPEN_UNIX 符 号 常 
量 《〈 在 图 2-5 中 它们 被 加 上 “SUS 强 制 的 ”的 标记 ) 。 只 有 遵循 XSI 的 实现 
才能 称 为 UNIX 系 统 。 

Open Group 拥有 UNIX 商 标 ， 他 们 使 用 Single UNIX Specification 定 
义 了 一 系列 接口 。 一 个 系统 要 想 称 为 UNIX 系统 ， 其 实现 必须 支持 这 些 


O. UNIX 系统 供应 丙 必须 以 文件 形式 提供 符合 性 声明 ， 并 通过 验证 
符合 性 的 测试 ， 才 能 得 到 使 用 UNIX 商 标的 许可 证 。 

有 些 接口 在 遵循 XSI 的 系统 中 是 可 选 的 ， 这 些 接口 根据 功能 被 分 成 
若干 选项 组 (option group) ， 有 具体 如 下 。 

加 密 : 由 符号 常量 XOPEN_CRYPE 标 记 。 

"实时 :由 符号 常量 XOPEN_REALTIME 标 记 。 

"局 级 实时 。 

"实时 线程 ， 由 符号 常量 XOPEN _REALTIME_THREADS 标 记 。 

“高 级 实时 线程 。 

Single UNIX Specification 是 Open Group 的 出 版 物 ， 而 Open Group 
是 由 两 个 工业 社团 X/Open 和 开放 系统 软件 基金 会 (Open System 
Software Foundation，OSF) 在 1996 年 合并 构成 的 。X/Open 过 去 出 版 了 
X/Open Portability Guide (X/Open 可 移植 性 指南 ) ， 它 采用 了 奎 干 特定 
标准 ， 填 补 了 其 他 标准 缺失 功能 的 空白 。 这 些 指南 的 目的 是 改善 应 用 的 
可 移植 性 ， 使 其 不 仅仅 符合 已 发 布 的 标准 。 

X/Open 在 1994 年 发 布 了 Single UNIX Specification 第 1 版 ， 因 为 它 大 
约 包含 了 1170 个 接口 ， 因 此 也 称 为 “Spec 1170”"。 它 源 自 通用 开放 软件 环 
境 (Common Open Software Environment, COSE) 的 倡议 ， 该 倡议 的 
目标 是 进一步 改善 应 用 程序 在 所 有 UNIX 操作 系统 实现 之 间 的 可 移植 
性 。COSE 的 成 员 包 括 Sun、IBM、HP、NovelVUSL 以 及 OSF 等 ， 他 们 的 
UNIX 都 包含 了 通用 商业 化 应 用 软件 使 用 的 接口 ， 这 较 之 仅仅 赞同 和 文 
持 标 准 前 进 了 一 大 步 。 从 这 些 应 用 软件 的 接口 中 选 出 的 1170 个 接口 被 
包括 在 下 列 标准 中 : X/Open ”通用 应 用 环境 (Common Application 
Environment, CAE) 第 4 发 行 版 〈 也 被 称 为 XPG4， 以 表示 它 与 其 前 映 
X/Open Portability Guide 的 历史 关系 ) ~ RAVO (System V 
Interface Definition, SVID) 第 3 版 Level 1 接口 、OSF 应 用 环境 规范 

(Application Environment Specification, AES) Full Use 接 口 。 

19974, Open Group fi [Single UNIX Specification 第 2 版 。 新 版 
本 增加 了 对 线程 、 实 时 接口 、64 位 处 理 、 大 文件 以 及 增强 的 多 字 节 字符 
处 理 等 功能 的 文 持 。 

Single UNIX Specification 第 3 版 (SUSv3) 由 Open Group 在 2001 年 发 
布 。SUSV3 的 基本 规范 与 EEE 标 准 1003.1-2001 相 同 ， 分 成 4 个 部 分 : 基 
本 定义 、 系 统 接 口 、shell 和 实用 程序 以 及 基本 理论 。SUSv3 还 包括 
X/Open Curses 第 4 发 行 版 第 2 版 ， 但 该 规范 并 不 是 POSIX.1 的 组 成 部 分 。 

2002 年 ，ISO 将 IEEE 标 准 1003.1-2001 批 准 为 国际 标准 ISO/IEC 
9945:2002。Open Group 在 2003 年 再 次 更 新 了 1003.1 标准 ， 包 括 了 技术 
方面 的 更 正 。ISO 将 其 批准 为 国际 标准 ISO/IEC 9945:2003。2004 年 4 











H, Open Group 发 布 了 Single UNIX Specification 第 3 版 2004 年 版 ， 将 更 
多 技术 上 的 更 正 合并 到 标准 的 正文 中 。 

2008 年 ，Single UNIX Specification 再 次 更 新 ， 包 括 了 更 正和 新 的 接 
口 、 移 除 弃 用 的 接口 以 及 将 一 些 未 来 可 能 被 删除 的 接口 标记 为 弃 用 接口 
等 。 另 外 ， 有 一 些 过 去 被 认为 可 选 的 接口 变 成 必 选 接口 ， 其 中 包括 异步 
WO、 屏 障 、 时 钟 选择 、 存 储 映像 文件 、 内 存 保护 、 读 写 锁 、 实 时 信 
号 、POSIX 信 号 量 、 旋 转 锁 、 线 程 安全 图 数 、 线 程 、 超 时 机 制 以 及 时 钟 
等 。 最 终 形 成 的 标准 就 是 基本 规范 的 第 7 发 行 版 ， 也 即 POSIX.1-2008。 
Open Group 把 这 个 版 本 和 X/OPEN Curses 规 范 的 更 新 版 打包 ， 并 于 2010 
年 作为 Single UNIX Specification 第 4 版 发 布 。 我 们 把 这 个 规范 称 为 
SUSv4。 





2.2.4 FIPS 


FIPS 代 表 的 是 联邦 信息 处 理 标 准 (Federal Information Processing 
Standard) ， 这 一 标准 是 由 美国 政府 发 布 的 ， 并 由 美国 政府 用 于 计算 机 
系统 的 采购 。FIPS151-1 (1989 年 4 月 ) 基于 IEEE 标 准 1003.1-1988 及 
ANSI C 标 准 草案 。 此 后 是 FIPS 151-2 (1993 年 5 月 ) ， 它 基于 IEEE 标 准 
1003.1-1990。 在 POSIX.1 中 列 为 可 选 的 某 些 功能 ， 在 FIPS 151-2 中 是 必 
需 的 。 所 有 这 些 可 选 功 能 在 POSIX.1-2001 中 已 成 为 强制 性 要 求 。 

POSIX.1 FIPS 的 作用 是 ， 它 要 求 任何 希望 癌 美国 政府 销售 符合 
POSIX.1 标 准 的 计算 机 系统 的 厂商 都 应 支持 POSIX.1 的 某 些 可 选 功能 。 
因为 POSIX.1 FIPS 已 经 撤回 ， 所 以 在 本 书 中 我 们 不 再 进一步 考虑 它 。 


2.3 UNIX 系 统 实现 


上 一 节 说 明了 3 个 由 各 自 独立 的 组 织 所 制定 的 标准 : ISO C, IEEE 
POSIX 以 及 Single UNIX Specification。 但 是 ， 标 准 只 是 接口 的 规范 。 这 
些 标 准 是 如 何 与 现实 世界 相关 连 的 呢 ? 这 些 标准 由 厂商 采用 ， 然 后 转变 
本 书 中 我 们 不 仅 对 这 些 标准 感 兴趣 ， 还 对 它们 的 有 具体 实现 
感 兴趣 。 

在 McKusick 等 [1996] 的 1.1 节 中 给 出 了 UNIX 系 统 家 族 树 的 详细 历 
史 。UNIX 的 各 种 版 本 和 变 体 都 起 源 于 在 PDP-11 系 统 上 运行 的 UNIX 分 时 
系统 第 6 版 (1976 年 ) 和 第 7 版 (1979 年 ) (通常 称 为 V6 和 V7) 。 这 两 
个 版 本 是 在 贝尔 实验 室 以 外 首先 得 到 广泛 应 用 的 UNIX 系 统 。 从 这 棵 树 











上 演进 出 以 下 3 个 分 支 。 
(1) AT&T 分 支 ， 从 此 引出 了 系统 II 和 系统 V 被 称 为 UNIX 的 商 
用 版 本 ) 。 


(2) 加 州 大 学 伯克利 分 校 分 文 ， 从 此 引出 4.xBSD 实 现 。 

(3) 由 AT&T 贝 尔 实 验 室 的 计算 科学 研究 中 心 不 断 开发 的 UNIX 人 研 
~ 从 此 引出 UNIX 分 时 系统 第 8 版 、 第 9 版 ， 终 止 于 1990 年 的 第 10 
WK 。 





2.3.1 SVR4 


SVR4 (UNIX System V Release 4) 是 AT&T 的 UNIX 系 统 实验 室 
(UNIX System Laboratories, USL， 其 前 身 是 AT&T 的 UNIX Software 
Operation) 的 产品 ， 它 将 下 列 系 统 的 功能 合并 到 了 一 个 一 致 的 操作 系统 
H: AT&T UNIX 系统 V 3.2 版 (SVR3.2) ~ Sun Microsystems 公 司 的 
SunOS 操 作 系 统 、 加 州 大 学 伯克利 分 校 的 4.3BSD 以 及 微软 的 Xenix 系 统 
(Xenix 是 在 V7 的 基础 上 开发 的 ， 后 来 又 采纳 了 很 多 系统 V 的 功能 )。 

其 源 代码 于 1989 年 后 期 发 布 ， 在 1990 年 开始 向 终端 用 户 提 供 。SVR4 符 
合 POSIX 1003.1 标 准 和 X/Open XPG3 标 准 。 

AT&T 也 出 版 了 系统 V 接 口 定义 (SVID) [AT&T 1989]。SVID 第 3 
版 说 明了 UNIX 系 统 要 达到 SVR4 质 量 要 求 必须 提供 的 功能 。 如 同 
POSIX.1 一 样 ，SVID 定 义 了 一 个 接口 ， 而 不 是 一 种 实现 。SVID 并 不 区 
分 系统 调用 和 库 函 数 。 对 于 一 个 SVR4 的 具体 实现 ， 应 查看 其 参考 手 
册 ， 以 了 解 系统 调用 和 库 函 数 的 不 同 之 处 [AT&T 1990e]。 








2.3.2 4.4BSD 


BSD (Berkeley Software Distribution) 是 由 加 州 大 学 伯克利 分 校 的 
计算 机 系统 研究 组 CCSRG) 研究 开发 和 分 发 的 。4.2BSD 于 1983 年 问 
世 ，4.3BSD 则 于 1986 年 发 布 。 这 两 个 版 本 都 在 VAX 小 型 机 上 运行 。 它 
们 的 下 一 个 版 本 4.3BSD Tahoe 于 1988 年 发 布 ， 在 一 台 称 为 Tahoe 的 小 型 
机 上 运行 (Leffler 等 [1989] 说 明了 4.3BSD ” Tahoe 版 )。 其 后 又 有 1990 年 
的 4.3BSD Reno 版 ， 它 支持 很 多 POSIX.1 的 功能 。 

最 初 的 BSD 系 统 包含 了 AT&T 专 有 的 源 代码 ， 它 们 需要 AT&T 许 可 
证 。 为 了 获得 BSD 系 统 的 源 代码 ， 首 先 需 要 持 有 AT&T 的 UNIX 源 代码 
许可 证 。 这 种 情况 正在 改变 ， 近 几 年 ， 越 来 越 多 的 AT&T 源 代码 被 蔡 换 
成 非 AT&T 源 代码 ， 很 多 添加 到 BSD 系 统 上 的 新 功能 也 来 自 于 非 AT&T 


方面 。 

1989 年 ， 伯 克利 将 4.3BSD Tahoe 中 很 多 非 AT&T 源 代码 包装 成 BSD 
网 络 软件 1.0 版 ， 并 使 其 成 为 可 公开 获得 的 软件 。1991 年 发 布 了 了 BSD 网络 
软件 2.0 版 ， 它 是 从 4.3BSD Reno 版 派生 出 来 的 ， 其 日 的 是 使 大 部 分 (如 
果 不 是 全 部 的 话 ) 4.4BSD 系 统 不 再 受 AT&T 许 可 证 的 限制 ， 这 样 ， 大 家 
都 可 以 得 到 源 代码 。 

4.4BSD-Lite 是 CSRG 计 划 开 发 的 最 后 一 个 发 行 版 。 由 于 与 USL 产 生 
的 法 律 纠纷 ， 该 版 本 曾 一 度 延 迟 推出 。 在 纠纷 解决 后 ，4.4BSD-Lite 立 即 
于 1994 年 发 布 ， 并 且 不 再 需要 具有 UNIX 源 代码 使 用 许可 证 就 可 以 使 用 
它 。1995 年 CSRG 发 布 了 修复 了 bug 的 版 本 。4.4BSD-Lite 第 2 发 行 版 是 
CSRG 的 最 后 一 个 BSD 版 本 (McKusick 等 [1996] 描 述 了 该 BSD 版 本 ) 。 

在 伯克利 所 进行 的 UNIX 开 发 工作 是 从 PDP-11 开 始 的 ， 然 后 转移 到 
VAX 小 型 机 上 ， 接 着 又 转移 到 工作 站 上 。20 世纪 90 年 代 早期 ， 伯 克利 
得 到 支持 在 广泛 应 用 的 80386 个 人 计算 机 上 开发 BSD 版 本 ， 结 果 产 生 了 
386BSD。 这 一 工作 是 由 Bill Jolitz 完 成 的 ， 其 工作 在 1991 年 全 年 的 
Dr.Dobb:s 期 刊 上 以 每 月 一 篇 文章 连载 发 表 。 其 中 很 多 代码 出 现在 BSD 网 
络 软件 2.0 版 中 。 














2.3.3 FreeBSD 


FreeBSD 基 于 4.4BSD-Lite 操作 系统 。 在 加 州 大 学 伯克利 分 校 的 
CSRG 决 定 终 止 其 在 UNIX 操 作 系 统 的 BSD 版 本 的 研发 工作 ， 而 且 
386BSD 项 目 被 忽视 很 长 时 间 之 后 ， 为 了 继续 坚持 BSD 系 列 ， 形 成 了 
FreeBSD 项 目 。 

由 FreeBSD 项 目 产 生 的 所 有 软件 ， 包 括 其 二 进 制 代码 和 源 人 代码， 都 


是 免费 使 用 的 。 为 了 测试 书 中 的 实例 ， 本 书 选取 了 4 个 操作 系统 ， 
FreeBSD 8.0 操 作 系统 是 其 中 之 一 。 
有 许多 基于 BSD 的 免费 操作 系统 。NetBSD 项 目 
(http://www.netbsd.org) 类 似 于 FreeBSD 项 目 ， 但 是 更 注重 不 同人 硬件 平 
台 之 间 的 可 移植 性 。OpenBSD 项 目 Chttp://www.openbsd. org) 也 类 似 于 
FreeBSD 项 目 ， 但 更 注重 于 安全 性 。 


2.3.4 Linux 


Linux 是 一 种 提供 类 似 于 UNIX 的 丰富 编程 环境 的 操作 系统 ， 
公用 许可 证 的 指导 下 ， Linux 是 免费 使 用 的 。Linux 的 普及 是 计算 机 产业 
中 的 一 道 亮 丽 风景 线 。Linux 经 常 是 支持 较 新 便 件 的 第 一 个 操作 系统 ， 
这 一 点 使 其 引 人 注 目 。 

Linux 是 由 Linus Torvalds 在 1991 年 为 蔡 代 MINIX 而 研发 的 。 一 位 当 
时 名 不 见 经 传人 物 的 努力 掀起 了 涪 激 巨 浪 ， 吸 引 了 遍布 全 世界 的 很 多 软 
件 开 发 者 ， 在 使 用 和 不 断 增 强 Linux 方 面 自愿 贡献 出 了 他 们 大 量 的 时 
间 。 

Ubuntu 12.04 的 Linux 分 发 版 本 是 用 以 测试 本 书 实例 的 操作 系统 之 
一 。 该 系统 使 用 了 Linux 操 作 系 统 3.2.0 版 内 核 。 


2.3.5 Mac OS X 


与 其 以 前 的 版 本 相 比 ，Mac OS X 使 用 了 完全 不 同 的 技术 。 其 核心 
操作 系统 称 为 “Darwin”， 它 基于 Mach 内 核 (Accetta 等 [1986]) 、 
FreeBSD 操 作 系 统 以 及 具有 面 回 对 象 框架 的 驱动 和 其 他 内 核 扩 展 的 绪 
合 。Mac OS X 10.5 的 Pntel 部 分 已 经 被 验证 为 是 一 个 UNIX 系 统 。 (RF 
UNIX 验 证 的 更 多 信息 ， 请 参见 
http://www.opengroup.org/certification/idx/UNIX.html) 。 

Mac OS X 10.6.8 (Darwin 10.8.0) 是 用 以 测试 本 书 实例 的 操作 系统 
rd 





2.3.6 Solaris 


Solaris 是 由 Sun Microsystems 〈( 现 为 Oracle〉 开 发 的 UNIX 系 统 版 
本 。 它 基于 SVR4， 在 超过 15 年 的 时 间 里 ，Sun Microsystems 的 工程 师 
对 其 功能 不 断 增强 。 它 是 唯一 在 商业 上 取得 成 功 的 SVR4 后 裔 ， 并 被 正 
式 验 证 为 UNIX 系 统 。 


2005 年 ，Sun Microsystems 把 Solaris 操 作 系 统 的 大 部 分 源 代码 开放 给 
公众 ， 作 为 OpenSolaris 开 放 源 代码 操作 系统 的 一 部 分 ， 试 图 建立 围绕 
Solaris 的 外 部 开发 人 员 社 区 。 


Solaris 10 UNIX 操 作 系 统 也 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 
2.3.7 FL{RUNIX 2 


已 经 通过 验证 的 其 他 UNIX 版 本 包括 : 

“AIX, IBMIMAJUNIX AZ; 

*HP-UX, HPHKHJUNIX AZ; 

‘IRIX, Silicon Graphics 版 的 UNIX 系 统 ; 
“UnixWare，SVR4 派 生 的 UNIX 系 统 ， 现 由 SCO 销 售 。 


2.4 标准 和 实现 的 关系 


前 面 提 到 的 各 个 标准 定义 了 任 一 实际 系统 的 子 集 。 本 书 主 要 关注 4 
种 实际 的 UNIX 系 统 : FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 和 
Solaris 10。 在 这 4 种 系统 中 ， 虽 然 只 有 Mac OS X Solaris 10 能 够 称 自 
己 是 一 种 UNIX 系 统 ， 但 是 所 有 这 4 种 系统 都 提供 UNIX 编 程 环境 。 因 为 
所 有 这 4 种 系统 都 在 不 同 程度 上 符合 POSIX 标 准 ， 所 以 我 们 也 将 重点 关 
注 POSIX.1 标 准 所 要 求 的 功能 ， 并 指出 这 4 种 系统 具体 实现 与 POSIX 之 
间 的 差别 。 仅 仅 一 个 特定 实现 所 具有 的 功能 和 例 程 会 被 清楚 地 标记 出 
来 。 我 们 还 关注 那些 属于 UNIX 系 统 必需 的 ， 但 却 在 符合 POSIX 标 准 的 
系统 中 是 可 选 的 功能 。 

应 当 看 到 ， 这 些 实现 都 提供 了 对 它们 早期 版 本 (如 SVR3.2 和 和 
4.3BSD) 功能 的 向 后 兼容 性 。 例 如 ，Solaris 对 POSIX.1 规范 中 的 非 阻 
Æ I/O (O_NONBLOCK) 以 及 传统 的 系统 V 中 的 方法 (O_NDELAY) 
都 提供 了 支持 。 本 书 将 只 使 用 POSIX.1 的 功能 ， 但 是 也 会 提 及 它 所 蔡 换 
的 是 哪 一 种 非 标准 功能 。 与 此 相 类 似 ，SVR3.2 和 4.3BSD 以 某 种 方法 提 
供 了 可 靠 的 信号 机 制 ， 这 种 方法 也 有 别 于 POSIX.1 标 准 。 第 10 章 将 只 说 
明 POSIX.1 的 信号 机 制 。 





2.0 | 


UNIX 系统 实现 定义 了 很 多 幻 数 和 和 常量， 其 中 有 很 多 已 被 硬 编码 到 
程序 中 ， 或 用 特定 的 技术 确定 。 由 于 大 量 标准 化 工作 的 努力 ， 己 有 寿 干 
种 可 移植 的 方法 用 以 确定 这 些 约 数 和 具体 实现 定义 的 限制 。 这 非常 有 助 
于 改善 UNIX 环 境 下 软件 的 可 移植 性 。 

以 下 两 种 类 型 的 限制 是 必需 的 。 

C1) 编译 时 限制 (例如 ， 短 整 型 的 最 大 值 是 什么 ?) 

(2) 运行 时 限制 (例如 ， 文 件 名 有 多 少 个 字符 ? ) 

编译 时 限制 可 在 头 文 件 中 定义 。 程 序 在 编译 时 可 以 包含 这 些 头 文 
件 。 但 是 ， 运 行 时 限制 则 要 求 进程 调用 一 个 函数 获得 限制 值 。 

另外 ， 某 些 限 制 在 一 个 给 定 的 实现 中 可 能 是 固定 的 〈 因 此 可 以 静态 
地 在 一 个 头 文件 中 定义 ) ， 而 在 另 一 个 实现 中 则 可 能 是 变动 的 〈 需 要 有 
一 个 运行 时 函数 调用 ) 。 这 种 类 型 限制 的 一 个 例子 是 文件 名 的 最 大 字符 
数 。SVR4 之 前 的 系统 V 由 于 历史 原因 只 允许 文件 名 最 多 包含 14 个 字符 ， 
而 源 于 BSD 的 系统 则 将 此 增加 为 255。 目 前 ， 大 多 数 UNIX 系 统 支 持 多 文 
件 系 统 类 型 ， 而 每 一 种 类 型 有 它 自 己 的 限制 。 文 件 名 的 最 大 长 度 依 赖 于 
该 文件 处 于 何 种 文件 系统 ， 例 如 ， 根 文件 系统 中 的 文件 名 长 度 限 制 可 能 
是 14 个 字符 ， 而 在 另 一 个 文件 系统 中 文件 名 长 度 限制 可 能 是 255 个 字 
符 ， 这 是 运行 时 限制 的 一 个 例子 。 

为 了 解决 这 类 问题 ， 提 供 了 以 下 3 种 限制 。 

(1) 编译 时 限制 〈 头 文件 ) 。 

(2) 与 文件 或 目录 无 关 的 运行 时 限制 〈sysconf 函 数 ) 。 

(3) 与 文件 或 目录 有 关 的 运行 时 限制 (pathconf 和 fpathconf 函 
Bl) . 

使 事情 变 得 更 加 复杂 的 是 ， 如 果 一 个 特定 的 运行 时 限制 在 一 个 给 定 
的 系统 上 并 不 改变 ， 则 可 将 其 静态 地 定义 在 一 个 头 文件 中 ， 但 是 ， 如 果 
没有 将 其 定义 在 头 文件 中 ， 应 用 程序 就 必须 调用 3 个 conf 函 数 中 的 一 个 
(我 们 很 快 束 会 对 它们 进行 说 明 〉 ， 以 确定 其 运行 时 的 值 。 


2.5.1 ISO C 限 制 | 


ISO ”C 定 义 的 所 有 编译 时 限制 都 列 在 尖 文 件 <limits.h> 中 见 图 2- 
6) 。 这 些 限 制 第 量 在 一 个 给 定 系 统 中 并 不 会 改变 。 表 中 第 3 列 列 出 了 



























































ISO C 标 准 可 接受 的 最 小 值 。 这 用 于 16 位 整 型 的 系统 ， 用 1 的 补 码 表示 。 

第 4 列 列 出 了 32 位 整 型 Linux 系 统 的 值 ， 用 2 的 补 码 表示 。 注 意 ， 我 们 没 
有 列 出 无 符号 数据 类 型 的 最 小 值 ， 这 些 值 应 该 都 为 0。 在 64 位 系统 中 ， 
其 long 整 型 的 最 大 值 与 表 中 long long 整 型 的 最 大 值 相 匹 配 。 


CHAR BIT 
CHAR MAX 
CHAR MIN 
SCHAR MAX 
SCHAR MIN 
UCHAR MAX 
INT_ MAX 
INT MIN 
UINT MAX 


SHRT_MAX 
SHRT_MIN 
USHRT MAX 


LLONG MAX 
LLONG MIN 
ULLONG MAX 
MB _LEN MAX 








我 们 将 会 





char ar | 

char 的 最 大 值 

char 的 最 小 人 

signed char 的 最 大 值 
signed char 的 最 小 人 
unsigned char MRA 
int HRA 

int 的 最 小 信 

unsigned int 的 最 大 什 
short 的 最 大 值 

short 的 最 小 什 

unsigned short 的 最 大 值 
long 的 最 大 人 

long 的 最 小 值 

unsigned long MRA 
long long 的 最 大 值 

long long 的 最 小 信 
unsigned long long 的 最 大 值 


2 147 483 647 
2 147 483 647 
4294 967 295 
9223 372.036 854 775 807 
9223 372.036 854775 807 


2 147 483 647 
2 147 483 648 
4 294 967 295 


2 147 483 647 
2 147 483 648 
4 294 967 295 


9223 372 036 854 775 807 
9 223 372 036 854775 808 
18446 744 073 709 551 615 | 18446 744073 709 551 615 
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图 2-6 <limits.h> 中 定义 的 整 型 值 大 小 








遇 到 的 一 个 区 别 是 系统 是 人 否 提供 市 符号 


或 无 符号 的 的 


PS As 


T 


值 。 从 图 2-6 中 的 第 4 列 可 以 看 出 ， 该 特定 系统 使 用 带 符 号 字符 。 从 图 中 
可 以 看 到 CHAR_MIN 等 于 SCHAR MIN，CHAR MAX 等 于 
SCHAR_MAX。 如 果 系 统 使 用 无 符号 字符 ， 则 CHAR_MIN 等 于 0， 
CHAR_MAX 等 于 UCHAR_MAX。 

在 头 文件 <float.h> 中 ， 对 浮 点 数据 类 型 也 有 类 似 的 一 组 定义 。 如 辱 
读者 在 工作 中 涉及 大 量 浮 点 数据 类 型 ， 则 应 仔细 查看 该 文件 。 

虽然 ISO C 标 准 规定 了 整 型 数据 类 型 可 接受 的 最 小 值 ， 但 POSIX.1 对 
C 标 准 进 行 了 扩充 。 为 了 符合 POSIX.1 标 准 ， 具 体 实现 必须 支持 
INT MAX 的 最 小 值 为 2 147 483 647, INT_MINA2 147 483 647, 
UINT_MAX 为 4 294 967 295。 因 为 POSIX.1 要 求 具体 实现 支持 8 位 的 char 
类 型 ， 所 以 CHAR_BIT 必 须 是 8，SCHAR_MIN 必 须 是 -128， 
SCHAR MAX 必须 是 127，UCHAR _ MAX 必须 是 255。 

我 们 会 遇 到 的 另 一 个 ISO ”C 常 量 是 FOPEN_MAX， 这 是 具体 实现 保 
证 可 同时 打开 的 标准 VO 流 的 最 小 个 数 ， 该 值 在 头 文件 <stdio.h> 中 定义 ， 
其 最 小 值 是 8。POSIX.1 中 的 STREAM_MAX ( 若 定 义 的 话 ) 则 应 与 
FOPEN_MAX 具 有 相同 的 值 。 

ISO ”C 还 在 <stdio.h> 中 定义 了 常量 TMP_MAX， 这 是 由 tmpnam 函 数 
o 的 最 大 个 数 。 关 于 此 常量 我 们 将 在 5.13 节 中 进行 更 多 
Thi HA 

虽然 ISO”C 定 义 了 常量 FILENAME_MAX， 但 我 们 应 避免 使 用 该 常 
量 ， 因 为 POSIX.1 提 供 了 更 好 的 蔡 代 常量 (NAME_MAX 和 
PATH _ MAX) ， 我 们 很 快 就 会 介绍 该 常量 。 

在 图 2-7 中 ， 我 们 列 出 了 本 书 所 讨论 4 种 平台 上 的 
FILENAME MAX、FOPEN_MAX 和 TMP_MAX 值 。 


限制 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 
16 20 20 


FOPEN MAX 20 
TMP_MAX 308 915 776 238 328 308 915 776 
FILENAME MAX 1024 4096 1024 














图 2-7 在 各 种 平台 上 ISO 的 限制 


2.5.2 POSIX 限 制 


POSIX.1 定 义 了 很 多 涉及 操作 系统 实现 限制 的 常量 ， 遗 憾 的 是 ， 这 





是 POSIX.1 中 最 令 人 迷惑 不 解 的 部 分 之 一 。 虽 然 POSIX.1 定 义 了 大 量 限 
制 和 常量 ， 我 们 只 关心 与 基本 POSIX.1 接 口 有 关 的 部 分 。 这 些 限制 和 常 
量 分 成 下 列 7 类 。 

(1) 数值 限制: LONG_BIT、SSIZE_ MAX 和 WORD BIT. 

(2) 最 小 值 : 图 2-8 中 的 25 个 常量 。 

(3) 最 大 值 :_POSIX_CLOCKRES_MIN。 

(4) 运行 时 可 以 增加 的 值 : CHARCLASS NAME_MAX、 

COLL _ WEIGHTS MAX、 LINE MAX、NGROUPS MAX 和 
RE_DUP_MAX。 

(5) 运行 时 不 变 值 〈 可 能 不 确定 ) : 图 2-9 中 的 17 个 常量 (加 上 
12.2 节 中 介绍 的 4 个 常量 和 14.5 节 中 介绍 的 3 个 常量 ) 。 

(6) 其 他 不 变 值 : NL_ARGMAX、NL_MSGMAX、NL_SETMAX 
和 NL_TEXTMAX。 

(7) 路 径 名 可 变 值 : FILESIZEBITS、LINK_MAX、 
MAX_CANON、MAX INPUT, NAME_MAX., PATH MAX, 
PIPE_BUF#ISYMLINK MAX. 

在 这 些 限 制 和 常量 中 ， 某 些 可 能 定义 在 <limits.h> 中 ， 其 余 的 则 按 具 
体 条 件 可 定义 、 可 不 定义 。 在 2.5.4 节 中 说 明 sysconf、pathconf 和 
fpathconf 函 数 时 ， 我 们 将 描述 可 定义 或 可 不 定义 的 限制 和 常量。 在 图 2-8 
中 ， 我 们 列 出 了 25 个 最 小 值 。 

这 些 最 小 值 是 不 变 的 一 它们 并 不 随 系统 而 改变 。 它 们 指定 了 这 些 特 
征 最 具 约 束 性 的 值 。 一 个 符合 POSIX.1 的 实现 应 当 提 供 至 少 这 样 大 的 
值 。 这 就 是 为 什么 将 它们 称 为 最 小 值 ， 虽 然 它 们 的 名 字 都 包含 了 
MAX。 另 外 ， 为 了 保证 可 移植 性 ， 一 个 严格 符合 POSIX 标 准 的 应 用 程 
序 不 应 要 求 更 大 的 值 。 我 们 将 在 本 书 的 适当 章节 说 明 每 一 个 常量 的 舍 
Ma 

一 个 严格 符合 (strictly conforming) POSIX 的 应 用 区 别 于 一 个 刚刚 
符合 POSIX (merely POSIX confirming) 的 应 用 。 符 合 POSIX 的 应 用 只 
使 用 在 IEEE 1003.1-2001 中 定义 的 接口 。 严 格 符合 POSIX 的 应 用 满足 更 
多 的 限制 ， 例 如 ， 不 依赖 于 POSIX 未 定义 的 行为 、 不 使 用 其 任何 已 弃 用 
的 接口 以 及 不 要 求 所 使 用 的 常量 值 大 于 图 2-8 中 所 列 出 的 最 小 值 。 








_POSIX ARG MAX exec 函数 的 参数 长 度 

_POSIX CHILD MAX 每 个 实际 用 户 D 的 子 进程 数 
_POSIX_DELAYTIMER_MAX | 定时 器 最 大 超 限 运行 次 数 
_POSIX_HOST_NAME MAX | gethostname 函数 返回 的 主机 名 长 度 
_POSIX_LINK MAX 至 一 个 文件 的 链接 数 
POSIX LOGIN NAME MAX | 登录 名 的 长 度 

_POSIX MAX CANON 终端 规范 输入 队列 的 字 节 数 

_POSIX MAX INPUT 终端 输入 队列 的 可 用 空间 

_POSIX NAME MAX 文件 名 中 的 字 节 数 ， 不 包括 终止 null 字 节 
_POSIX_NGROUPS MAX — | 每 个 进程 同时 添加 的 组 ID 数 

_POSIX OPEN MAX 每 个 进程 的 打开 文件 数 

_POSIX PATH MAX 路 从 名 中 的 字 节 数 ， 包 括 终止 null 字 节 


POSIX PIPE BUF 能 原子 地 写 到 一 个 管道 中 的 字 节 数 


当 使 用 间 隐 表示 法 \{m,n\} 时 , regexec 和 regcomp 函数 允许 
的 基本 正则 表达 式 重复 发 生 次 数 

POSIX RTSIG MAX 为 应用 预 留 的 实时 信号 编号 个 数 
_POSIX_SEM NSEMS_MAX | 一 个 进程 可 以 同时 使 用 的 信号 量 个 数 
POSIX SEM VALUE MAX | 信号 量 可 持 有 的 值 

POSIX SIGQUEUE MAX | 一 个 进程 可 发 送 和 挂 起 的 排队 信号 的 个 数 
_POSIX_SSIZE_MAX 能 存在 ssize t 对 象 中 的 值 
_POSIX_STREAM MAX 一 个 进程 能 同时 打开 的 标准 VO 流 数 
POSIX SYMLINK MAX — | 符号 链接 中 的 字 节 数 
_POSIX_SYMLOOP MAX — | 在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 
_POSIX TIMER MAX 每 个 进程 的 定时 器 数目 
POSIX TTY NAME MAX | 终端 设备 名 长 度 ， 包 括 终止 nul ZH 
_POSIX TZNAME MAX 时 区 名 字 节 数 


POSIX_RE DUP MAX 








图 2-8 <limits.h> 中 的 POSIX.1 最 小 值 
遗憾 的 是 ， 这 些 不 变 最 小 值 中 的 某 一 些 在 实际 应 用 中 太 小 了 。 例 
如 ， 目 前 在 大 多 数 UNIX 系 统 中 ， 每 个 进程 可 同时 打开 的 文件 数 远 远 超 
过 20。 另 外 ，_POSIX_PATH_MAX 的 最 小 限制 值 为 255， 这 太 小 了 ， 路 
径 名 可 能 会 超过 这 一 限制 。 这 意味 着 在 编译 时 不 能 使 用 
_POSIX_OPEN MAX “和 _POSIX_PATH _ MAX 这 两 个 常量 作为 数组 长 


je. 

图 2-8 中 的 25 个 不 变 最 小 值 的 每 一 个 都 有 一 个 相关 的 实现 值 ， 其 名 
字 是 将 图 2-8 中 的 名 字 删 除 前 级 _POSIX_ 后 构成 的 。 没 有 _POSIX_ 前 级 的 
名 字 用 于 给 定 具体 实现 支持 的 该 不 变 最 小 值 的 实际 值 〈 这 25 个 实现 值 是 
本 节 开 始 部 分 所 列 出 的 1、4、5、7 类 : 2 个 是 运行 时 可 以 增加 的 值 、15 
个 是 运行 时 不 变 值 、7 个 是 路 径 名 可 变 值 ， 以 及 数值 SSIZE_MAX) 。 问 
题 是 并 不 能 确保 所 有 这 25 个 实现 值 都 在 <limit.h> 头 文件 中 定义 。 

例如 ， 某 个 特定 值 可 能 不 在 此 头 文件 中 定义 ， 其 理由 是 : 一 个 给 定 
进程 的 实际 值 可 能 依赖 于 系统 的 存储 总 量 。 如 果 没 有 在 头 文件 中 定义 它 
们 ， 则 不 能 在 编译 时 使 用 它们 作为 数组 边界 。 所 以 ，POSIX.1 提 供 了 3 个 
运行 时 函数 以 供 调 用 ， 它 们 是 : sysconf、pathconf 以 及 fpathconf。 使 用 
这 3 个 函数 可 以 在 运行 时 得 到 实际 的 实现 值 。 但 是 ， 还 有 一 个 问题 ， 其 
中 某 些 值 由 POSIX.1 定义 为 “可 能 不 确定 的 ”( 逻 辑 上 无 限 的 ) ， 这 就 意 
味 着 该 值 没有 实际 上 限 。 例 如 ， 在 Solaris 中 ， 进 程 结 束 时 注册 可 运行 
atexit 的 函数 个 数 仅 受 系统 存储 总 量 的 限制 。 所 以 在 Solaris 中 ， 
ATEXIT_MAX 被 认为 是 不 确定 的 。2.5.5 节 还 将 讨论 运行 时 限制 不 确定 
的 问题 。 




















ARG MAX 
ATEXIT_MAX 
CHILD MAX 
DELAYTIMER MAX 


exec MSR BRUCK RI POSIX ARG MAX 

可 用 atexit 函数 登记 的 最 大 函数 个 数 2 

每 个 实际 用 户 ID 的 子 进程 最 大 个 数 POSIX CHILD MAX 

定时 器 最 大 超 限 运 行 次 数 POSIX DELAYTIMER MAX 


HOST_NAME MAX 
LOGIN NAME MAX 
OPEN MAX 
PAGESIZE 
RTSIG_MAX 
SEM_NSEMS MAX 
SEM VALUE MAX 
SIGQUEUE_MAX 
STREAM MAX 
SYMLOOP_MAX 
TIMER MAX 
TTY_NAME MAX 
TZNAME MAX 


gethostnane 返回 的 主机 名 长 度 
登录 名 最 大 长 度 

BRP TREC AER PF GC EE 
系统 内 存 页 大 小 【以 字 忆 为 单位 ) 

为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 
一 个 进程 可 使 用 的 信号 量 最 大 个 数 

fe eA 

一 个 进程 可 排队 信号 的 最 大 个 数 


一 个 进程 一 次 可 打开 的 标准 VO 流 的 最 大 个 数 


路 径 解 析 过 程 中 可 访问 的 符号 链 搂 煞 
一 个 进程 的 定时 器 最 大 个 数 


AREARE, PORREN null 7H 


时 区 名 的 字 书 数 


POSIX HOST NAME MAX 
POSIX_LOGIN NAME MAX 
_POSIX_OPEN MAX 
l 
_POSIX_RTSIG_MAX 
_POSIX_SEM_NSEMS_MAX 
_POSIX_SEM_VALUE MAX 
_POSIX_SIGQUEUE_ MAX 
_POSIX_STREAM MAX 
_POSIX_SYMLOOP_MAX 








_POSIX_TIMER_MAX 
_POSIX_TTY_NAME MAX 
_POSIX_TZNAME MAX 








图 2-9 <limits.h> 中 的 POSIX.1 运 行 时 不 变 值 


2.5.3 XSI[ 民 制 


XSI 定 义 了 代表 实现 限制 的 几 个 常量 。 


(1) 最 小 值 : 图 2-10 中 列 出 的 5 个 常量 。 


(2) 运行 时 不 变 值 〈 可 能 不 确定 ) : IOV_MAX 和 PAGE SIZE. 


图 2-10 列 出 了 最 小 值 。 最 后 两 个 常量 值 说 明了 POSIX.1 最 小 值 太 
小 的 情况 ， 根 据 推 测 这 可 能 是 考虑 到 了 骸 入 式 POSIX.1 实 现 。 为 此 ， 


UNIX Specification 为 符合 XSI 的 系统 增加 了 有 具有 较 大 最 小 值 的 符 


mm 


NL LANGMAX oii eat KE TA 
NZERO 默认 进程 优先 级 


XOPEN IOV MAX | readv ak writev T -i iovec 结构 个 数 
KOPEN NAME MAX | 文件 名 中 的 字 节 
XOPEN PATH MAX | 路 径 名 中 ae 





图 2-10 <limits.h> 中 的 XSI 最 小 值 
2.5.4 pki aVvsysconf. pathconf#ilfpathconf 


我 们 已 列 出 了 实现 必须 文 持 的 各 种 最 小 值 ， 但 是 怎样 才能 找到 一 个 
特定 系统 实际 文 持 的 限制 值 呢 ? 正如 前 面 提 到 的 ， 茶 些 限制 值 在 编译 时 
是 可 用 的 ， 而 为 外 一 些 则 必须 在 运行 时 确定 。 我 们 也 曾 提 及 茶 些 限制 值 
在 一 个 给 定 的 系统 中 可 能 是 不 会 更 改 的 ， 而 其 他 限制 值 可 能 会 更 改 ， 因 
们 与 文件 和 目录 相关 联 。 运 行 时 限制 可 调用 下 面 3 个 函数 之 一 获 











hie <unistd.h> 
long sysconf(int name); 
long pathconf(const char *pathname, int name); 
log fpathconf(int fd, int name); 
所 有 函数 返回 值 : 奉 成 功 ， 返 回 相 应 值 ; 奋 出 错 ， 返 回 -1〈 见 后 ) 
后 面 两 个 函数 的 差别 是 : 一 个 用 路 径 名 作为 其 参数 ， 男 一 个 则 取 文 
件 描述 符 作 为 参数 。 
图 2-11 中 列 出 了 sysconf 函 数 所 使 用 的 name 参 数 ， 它 用 于 标识 系统 限 
制 。 以 _SC_ 开 始 的 常量 用 作 标 识 运行 时 限制 的 sysconf 参 数 。 图 2-12 列 出 
了 pathconf 和 fpathconf 函 数 为 标识 系统 限制 所 使 用 的 name 人 参数 。 以 _PC _ 
开始 的 常量 用 作 标 识 运 行 时 限制 的 pathconf 或 fpathconf 参 数 。 
我 们 需要 更 详细 地 讨论 一 下 这 3 个 函数 不 同 的 返回 值 。 
(1) 如 果 name 参 数 并 不 是 一 个 合适 的 常量， 这 3 个 函数 都 返回 
-1， 并 把 errno 置 为 EINVAL。 图 2-11 和 图 2-12 的 第 3 列 给 出 了 我 们 在 整 本 

















书 中 将 要 涉及 的 限制 常量 。 
(2) 有 些 name 会 返回 一 个 变量 值 〈 返 回 值 >0) 或 者 提示 该 值 是 不 
确定 的 。 不 确定 的 值 通过 返回 -1 来 体现 ， 而 不 改变 errmo 的 值 。 








ARG_MAX 
ATEXIT_MAX 
CHILD MAX 
ENEE 
COLL_WEIGHTS MAX 


DELAYTIMER MAX 
HOST NAME MAX 
TOV_MAX 


LINE_MAX 
LOGIN_NAME MAX 
NGROUPS_MAX 
OPEN_MAX 
PAGESIZE 
PAGE_SIZE 
RE_DUP_MAX 


RTSIG_MAX 
SEM NSEMS MAX 
SEM VALUE MAX 


SIGOUEUE MAX 
STREAM_MAX 


SYMLOOP MAX 
TIMER MAX 
TTY_NAME MAX 
TZNAME MAX 


exec 函数 的 参数 最 大 长 度 (FH) 

可 用 atexit 函数 登记 的 最 大 函数 个 数 
每 个 实际 用 户 ID 的 最 大 进程 数 

每 秒 时 钟 滴答 数 

在 本 地 定义 文件 中 可 以 赋予 LC_COLLATE 顺序 关 


键 字 项 的 最 大 权重 数 


定时 器 最 大 超 限 运行 次 数 
gethostname 函数 返回 的 主机 名 最 大 长 度 
readv 或 writev 函数 可 以 使 用 最 多 的 iovec 结 


构 的 个 数 


实用 程序 输入 行 的 最 大 长 度 

登录 名 的 最 大 长 度 

每 个 进程 同时 添加 的 最 大 进程 组 ID 数 

每 个 进程 最 大 打开 文件 数 

系统 存储 页 长 度 〈 字 节 数 ) 

系统 存储 页 长 度 【 字 节 数 ) 

当 使 用 间 隐 表示 法 \m, nN} 时 ， 函 数 regexec 和 
regcomp 允许 的 基本 正则 表达 式 重复 发 生 次 数 

为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 

一 个 进程 可 使 用 的 信号 量 最 大 个 数 
信号 量 的 最 大 值 

一 个 进程 可 排队 信号 的 最 大 个 数 

一 个 _sC_ STREAM MAX 进程 在 任意 给 定时 刻 标准 11O 


HRAM. WREX, WAE ropen Max 有 相同 值 


在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 
每 个 进程 的 最 大 定时 器 个 数 
终端 设 备 名 长 度 ， 包 括 终止 mull FH 
时 区 名 中 的 最 大 字 池 数 


_SC_ARG_MAX 
_SC_ATEXIT_MAX 
_SC_CHILD_MAX 
_SC_CLK_TCK 
_SC_COLL_WEIGHTS MAX 


_SC_DELAYTIMER_ MAX 
_SC_HOST_NAME MAX 
_SC_IOV_MAX 


_SC_LINE_MAX 
_SC_LOGIN_NAME MAX 
_SC_NGROUPS_MAX 
_SC_OPEN_MAX 
_SC_PAGESIZE 
_SC_PAGE_SIZE 
_SC_RE_DUP_MAX 


_SC_RTSIG_MAX 
_SC_SEM_NSEMS MAX 
_SC_SEM VALUE MAX 
_SC_SIGQUEUE_MAX 
_SC_STREAM_MAX 


_SC_SYMLOOP_MAX 
_SC_TIMER MAX 
_SC_TTY_NAME_MAX 
_SC_TZNAME MAX 





图 2-11 对 sysconf 的 限制 及 name 参 数 


PILESIZEBITS htt SBA dea He A | PC FILESIZEBITS 
录 中 允许 的 普通 文件 最 大 长 度 所 

需 的 最 小 位 (bit) 数 

LINK MAX 文件 链接 计数 的 最 大 值 _PC_LINK MAX 
MAX CANON INUMA NIINA HA | PC MAX CANON 
MAX INPUT Pieri ISLET ASTOR | PC MAX INPUT 


NAME MAX 文件 名 的 最 大 字 书 数 (不 包括 | _PC_NRME MAX 

Ait null 字 节 ) 

PATH MAX 相对 路 径 名 的 最 大 字 池 数 ， 包 | _PC PATH MAX 

括 终止 null 字 节 

PIPE BUF 能 原子 地 写 到 管道 的 最 大 字 节 数 | PC PIPE BUF 
_POSTX_TIMESTAMP RESOLUTION | 文件 时 间 器 的 纳 秒 精度 PC TIMESTAMP RESOLUTION 
SYMLINK MAX 符号 链接 的 字 书 数 PC SYMLINK MAX 











图 2-12 对 pathconf 和 fpathconf 的 限制 及 name 人 参数 

(3) _SC_CLK_TCK 的 返回 值 是 每 秒 的 时 钟 滴答 数 ， 用 于 times 函 

数 的 返回 值 (8.17 节 ) 。 
对 于 pathconf 的 参数 pathname 和 fpathconf 的 参数 fd 有 很 多 限制 。 如 果 

不 满足 其 中 任何 一 个 限制 ， 则 结果 是 未 定义 的 。 

(1) PC MAX_CANON 和 _PC_MAX _INPUT 引 用 的 文件 必须 是 终 
端 文 件 。 

(2) PC LINK MAX 和 PC TIMESTAMP RESOLUTION 引用 
的 文件 可 以 是 文件 或 目录 。 如 果 是 目录 ， 则 返回 值 用 于 目录 本 身 ， 而 不 
用 于 目录 内 的 文件 名 项 。 

(3) PC _FILESIZEBITS 和 _PC_ NAME MAX 引用 的 文件 必须 是 目 
录 ， 返 回 值 用 于 该 目录 中 的 文件 名 。 

(4) _PC_PATH_MAX 引 用 的 文件 必须 是 目录 。 当 所 指定 的 目录 是 
工作 目录 时 ， 返 回 值 是 相对 路 径 名 的 最 大 长 度 〈 遗 憾 的 是 ， 这 不 是 我 们 








想 要 知道 的 一 个 绝对 路 径 名 的 实际 最 大 长 度 ， 我 们 将 在 2.5.5 节 中 再 次 回 
到 这 一 问题 上 来 ) 。 
(5) _PC_PIPE_BUF 引 用 的 文件 必须 是 管道 、FIFO 或 目录 。 在 管 
道 或 FIFO 情 况 下 ， 返 回 值 是 对 所 引用 的 管道 或 FIFO 的 限制 值 。 对 于 目 
录 ， 返 回 值 是 对 在 该 目录 中 创建 的 任 一 FIFO 的 限制 值 。 
(6) _PC_SYMLINK_MAX 引 用 的 文件 必须 是 目录 。 返 回 值 是 该 目 

含 字符 串 的 最 大 长 度 。 

SE pl 

图 2-13 中 所 示 的 awk(1) 程 序 构建 了 一 个 C 程 序 ， 它 打印 各 pathconf 和 
sysconf 符 号 的 值 。 

#!/usr/bin/awk -f 
BEGIN { 

printf ("include \"apue.h\"\n") 
intf ("#include <errno.h>\n") 
printf ("#include <limits.h>\n") 
("\n") 
printf ("static void pr sysconf(char *, int);\n") 

| 

| 

| 


nee 





f 


intf ("static void pr pathconf (char *, char *, int);\n") 
printf ("\n") 











printf ("int\n") 


printf ("main(int argc, char *argv[])\n") 
printf ("{\n"} 
printf("\tif targe != 2)\n") 
printf ("\t\terr_quit(\"usage: a.out <dirname>\") ;\n\n") 
FS="\tt" 
while (getline <"sysconf.sym" > 0) { 
printf ("#ifdef %s\n", $1) 
printf ("\tprintf (\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef ts\n", $2) 
printf ("\tpr_sysconf(\"%s =\", %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 
} 
close ("sysconf.sym") 
while (getline <"pathconf.sym" > 0) { 
printf ("#ifdef %s\n", $1) 
printf ("\tprintf(\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf("\tprintf(\"no symbol for %s\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef %s\n", $2) 
printf ("\tpr_pathconf(\"%s =\", argv[1], %s);\n", $1, $2) 
printf ("#else\n") 
printf ("\tprintf(\"no symbol for %s\\n\");\n", $2) 
printf ("#endif\n") 


close ("pathconf.sym") 
exit 


END { 
printf ("\texit (0) ;\n") 
printf ("}\n\n") 
printf ("static void\n") 
printf ("pr_sysconf(char *mesg, int name) \n") 
pein {Nn} 
printf("\tlong val; \n\n") 
printf ("\tfputs (mesg, stdout) ;\n") 
printf("\terrno = 0;\n") 
printf("\tif ((val = sysconf(name)) < 0) {\n"} 
printf("\t\tif (errno != 0) {\n"} 
printf("\t\t\tif (errno == EINVAL) \n") 
print£("\t\t\t\tfiputs(\" (not supported) \\n\", stdout) ;\n") 
printf ("\t\t\telse\n") 
printf ("\t\t\t\terr_sys(\"sysconf error\");\n") 
printf("\t\t) else {\n"} 
printf ("\t\t\tfputs(\" (no limit) \\n\", stdout) ;\n") 
printf("\t\t) \n") 
printf("\t} else {\n"} 
printf ("\t\tprintf(\" S%ld\\n\", val);\n") 
printf ("\t) Va") 


printf ("}\n\n") 

printf ("static void\n") 

printf ("pr pathconf (char *mesg, char *path, int name) \n") 
printf ("{\n"} 

printf ("\tlong val; \n") 

printf ("\n") 

printf ("\tfputs (mesg, stdout) ;\n") 

printf ("\terrno = 0;\n") 

printf ("\tif ((val = pathconf (path, name)) < 0) {\n"} 




















printf ("\t\tif (errno != 0) {\n"] 

printf ("\t\t\tif (errno == EINVAL) \n") 
printf("\t\t\t\tfputs(\" (not supported) \\n\", stdout); \n") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr_sys(\"pathconf error, path = %%s\", path) ;\n") 
printf ("\t\t) else {\n"} 

printf ("\t\t\tfputs(\" (no Limit) \\n\", stdout) ;\n") 

printf ("\t\t) \n") 

printf ("\t) else {\n"} 

printé("\t\tprinté(\" $$1d\\n\", val) ¢\n") 

printf ("\t}\n") 

printf ("}\n") 


图 2-13 构建 C 程 序 以 打印 所 有 得 到 支持 的 系统 配置 限制 
该 awk 程 序 读 两 个 输入 文件 一 一 pathconf.sym 和 和 sysconfig.sym， 这 两 
个 文件 中 包含 了 用 制 表 符 分 隔 的 限制 名 和 符号 列表 。 并 非 每 种 平台 都 定 
义 所 有 符号 ， 所 以 围绕 每 个 pathconf 和 sysconf 调 用 ，awk 程 序 都 使 用 了 
必要 的 外 fdef 语 句 。 
例如 ，awk 程 序 将 输入 文件 中 类 似 于 下 列 形式 的 行 











NAME MAX PC NAME MAX 
转换 成 下 列 C 代 码 : 
#ifdef NAME MAX 
printf("NAME_MAX is defined to be %d\n", NAME_MAX+0); 
#else 
printf("no symbol for NAME_MAX\n"); 
#endif 
#ifdef PC NAME MAX 
pr_pathconf("NAME_MAX =", argv[1], PC_NAME_ MAX); 
#else 
printf("no symbol for _PC_NAME_MAX\n"); 
#endif 
由 awk 产生 的 C 程 序 如 网 2-14 所 示 ， 它 会 打印 所 有 这 些 限制 ， 并 处 理 
未 定义 限制 的 情况 。 


#include "apue.h" 
tinclude <errno.h> 
tinclude <limits,h> 


static void pr sysconf (char *, int); 
static void pr pathconf (char *, char *, int); 


int 


main(int argc, char *argv(]) 


if (arge != 2) 


err quit("usage: 


#ifdef ARG MAX 
printf ("ARG MAX defined to be 
#else 


Slda\n", 


a.out <dirname>"); 


(long) ARG_MAX+0) ; 


printf("no symbol for ARG MAX\n"); 


#endif 

#ifdef _SC ARG MAX 
pr_sysconf ("ARG MAX =", 

#else 


_SC_ARG MAX); 


printf("no symbol for _ SC ARG MAX\n"); 


#endif 


/* similar processing for all the rest of the sysconf symbols... 


#ifdef MAX CANON 
printf ("MAX CANON defined to be 
#else 


Slda\n", (long)MAX_CANON+0) > 


printf("no symbol for MAX _CANON\n") > 


#endif 

#ifdef _PC_MAX CANON 
pr_pathconf ("MAX CANON =", 

#else 


argv 


[1], _PC MAX CANON) ; 


printf("no symbol for PC MAX CANON\n"); 


#endif 


/* similar processing for all the rest of the pathconf symbols... 


exit(0); 


static void 
pr_sysconf(char *mesg, 
{ 


int name) 


long val; 
fputs (mesg, stdout); 
errno O; 
if ((val = sysconf(name)) < 0) 
if (errno != 0) q 
if (errno == EINVAL) 
fputs (" 
else 


(not supported) \n", 


{ 


stdout) ; 


err sys("syscont exxror™) is 


} else { 
Fputs(" (id Pasi’, 
} 

} else { 
printr (s 


Sld\n", val); 


static void 


Stdovt):7 


bas 


my 


pr pathconf (char *mesg, char *path, int name) 


| 


long val; 


fputs (mesg, stdout) ; 
errno = 0; 
1f ((val = pathconf (path, name)) < 0) { 
1f (errno != 0) | 
if (errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 
err sys("pathconf error, path = %s", path); 
} else { 
fputs(" (no limit) \n", stdout) ; 
} else { 
printf(" sld\n", val); 


图 2-14 打印 所 有 可 能 的 sysconf 和 pathconf 值 
图 2-15 总 结 了 在 本 书 讨 论 的 4 种 系统 上 图 2-14 所 示 程 序 的 输出 结 
果 。“ 无 符号 ”项 表示 该 系统 没有 提供 相应 _SC 或 _ PC 符号 以 查询 相关 第 
量 值 。 因 此 ， 该 限制 是 未 定义 的 。 与 此 对 比 ，“ 不 支持 ”项 表示 该 符号 由 
系统 定义 ， 但 是 未 被 sywsconf 和 pathcon 函 数 识别 。 “无 限制 ?项 表示 该 系统 
将 相关 常量 定义 为 无 限制 ， 但 并 不 表示 该 限制 值 可 以 是 无 限 的 ， 它 只 表 
示 该 限制 值 不 确定 。 
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图 2-15 配置 限制 的 实例 

注意 ， 有 些 限制 报告 地 并 不 正确 。 例 如 ， 在 Linux 中 ， 
SYMLOOP_MAX 被 报告 成 无 限制 ， 但 是 检查 源 代码 后 就 会 发 现 ， 实 际 
上 它 在 硬 编码 中 有 限制 值 ， 这 一 限制 将 循环 缺失 的 情况 下 过 有 历 连 续 符 号 
链接 的 数目 限制 为 40〈 参 阅 fsnamei.c 中 的 follow_link 函 数 ) 。 

Linux 中 另 一 个 洪 在 的 不 精确 的 来 源 是 pathconf 和 fpathconf 函 数 都 是 
在 C 库 函数 中 实现 的 ， 这 些 函 数 返 回 的 配置 限制 依赖 于 底层 的 文件 系统 
ae 因此 如 果 你 的 文件 系统 不 被 C 库 熟知 的 话 ， 函 数 返 回 的 是 一 个 猜 
测 值 。 

我 们 将 在 4.14 节 中 看 到 ，UFS 是 Berkeley 快 速 文 件 系 统 的 SVR4 实 
现 ，PCFS 是 Solaris 的 MS-DOS FAT 文 件 系 统 的 实现 。 














2.5.5 个 确定 的 运行 压 | 


前 面 已 提 及 某 些 限 制 值 可 能 是 不 确定 的 。 我 们 遇 到 的 问题 是 ， 如 果 
这 些 限 制 值 没有 在 头 文件 <limits.h> 中 定义 ， 那 么 在 编译 时 也 就 不 能 使 用 
它们 。 但 是 ， 如 果 它 们 的 值 是 不 确定 的 ， 那 么 在 运行 时 它们 可 能 也 是 未 
定义 的 。 让 我 们 来 观察 两 个 特殊 的 情况 ， 为 一 个 路 径 名 分 配 存储 区 ， 以 
及 确定 文件 描述 符 的 数目 。 

1. 路 径 名 

很 多 程序 需要 为 路 径 名 分 配 存 储 区 ， 一 般 来 说 ， 在 编译 时 就 为 其 分 
配 了 存储 区 ， 而 且 不 同 的 程序 使 用 各 种 不 同 的 约 数 〈 其 中 很 少 是 正确 
的 ) 作为 数组 长 度 ， 如 256、512、1 024 或 标准 IO 常量 BUFSIZ 。 
4.3BSD 头 文件 <sys/param.h> 中 的 常量 MAXPATHLEN 才 是 正确 的 值 ， 
但 是 很 多 4.3BSD 应 用 程序 并 未 使 用 它 。 

POSIX.1 试 图 用 PATH_MAX 值 来 帮助 我 们 ， 但 是 如 果 此 值 是 不 确定 
的 ， 那 么 仍 是 毫 无 帮助 的 。 图 2-16 程 序 是 本 书 用 来 为 路 径 名 动态 分 配 存 
储 区 的 函数 。 











#include "apue ,hn 
tinclude <errno.h> 
include <limits.h> 


Hifdef PATH MAX 

static long pathmax = PATH MAX; 
telse 

static long pathmax = 0; 

tendif 


static long posix version = 0; 
static long xsi version = 0; 


/* If PATH MAX is indeterminate, no guarantee this is adequate */ 
#define PATH MAX GUESS 1024 


char * 
path alloc(size t *sizep) /* also return allocated size, if nonnull */ 


char *ptr; 
size t size; 


if (posix version == 0) 
posix version = sysconf(_SC_VERSION) ; 


if (xsi_version == 0) 
xsi version = sysconf(_SC_XOPEN VERSION) ; 


if (pathmax == 0) { /* first time through */ 
errno = 0; 
if ((pathmax = pathconf("/", PC PATH MAX)) < 0) { 
if (errno == 0) 
pathmax = PATH MAX GUESS; /* it's indeterminate */ 
else 
err_sys("pathconf error for PC PATH MAX"); 
} else { 
pathmax++;  /* add one since it's relative to root */ 


/* 
* Before POSIX.1-2001, we aren't guaranteed that PATH MAX includes 
* the terminating null byte. Same goes for XPG3. 
xf 
if ((posix version < 200112L) && (xsi version < 4)) 
size = pathmax + 1; 
else 


size = pathmax; 


if ((ptr = malloc(size)) == NULL) 
err sys("malloc error for pathname") ; 


if (sizep != NULL) 
*sizep = size; 
return (ptr) ; 


图 2-16 为 路 径 名 动态 地 分 配 空间 

如 果 <limits.h> 中 定义 了 常量 PATH _MAX， 那 么 就 没有 任何 问题 ; 

如 果 未 定义 ， 则 需 调用 pathconf。 因 为 pathconf 的 返回 值 是 基于 工作 目录 
的 相对 路 径 名 的 最 大 长 度 ， 而 工作 目录 是 其 第 一 个 参数 ， 所 以 ， 指 定 根 
目录 为 第 一 个 参数 ， 并 将 得 到 的 返回 值 加 1 作为 结果 值 。 如 果 pathconf 
指明 PATH_MAX 是 不 确定 的 ， 那 么 我 们 就 只 能 猜测 某 个 值 。 

对 于 PATH_MAX 是否 考虑 到 在 路 径 名 末尾 有 一 个 “null 字 节 这 一 
点 ，2001 ”年 以 前 的 POSIX.1 版 本 表述 得 并 不 清楚 。 出 于 安全 方面 的 考 
虑 ， 如 果 操 作 系 统 的 实现 符合 某 个 先前 版 本 的 标准 ， 但 并 不 符合 Single 
UNIX Specification 的 任何 版 本 (SUS 明 确 要 求 在 结尾 处 加 一 个 终止 null 
字 节 ) ， 则 需要 在 为 路 径 名 分 配 的 存储 量 上 加 1。 

处 理 不 确定 结果 情况 的 正确 方法 与 如 何 使 用 分 配 的 存储 空间 有 天。 
例如 ， 如 果 我 们 为 getcwd 调 用 分 配 存储 空间 (返回 当前 工作 目录 的 绝对 
路 径 名 ， 见 4.23 节 ) ， 但 分 配 到 的 空间 太 小 ， 则 会 返回 一 个 错误 ， 并 
将 errmno 设 置 为 ERANGE。 然 后 可 调用 realloc 来 增加 分 配 的 空间 〈 见 7.8 节 
和 习题 4.16) 并 重 试 。 不 断 重 复 此 操作 ， 直 到 getcwd 调 用 成 功 执行 。 

2. 最 大 打开 文件 数 

守护 进程 (daemon process， 在 后 台 运 行 且 不 与 终端 相连 接 的 一 种 
进程 》 中 一 个 常见 的 代码 序列 是 关闭 所 有 打开 文件 。 某 些 程序 中 有 下 列 
形式 的 代码 序列 ， 这 上段 程序 假定 在 <sys/param.h> 头 文件 中 定义 了 常量 
NOFILE 。 

#include <sys/param.h>; 

for (i = 0; i < NOFILE; i++) 

close(i); 

另外 一 些 程序 则 使 用 某 些 <stdio.h> 版 本 提供 的 作为 上 限 的 常量 
_NFILE。 某 些 程序 则 直接 将 其 上 限 值 便 编码 为 20。 但 是 ， 这 些 方法 都 
不 是 可 移植 的 。 

我 们 希望 用 POSIX.1 的 OPEN_MAX 确 定 此 值 以 提高 可 移植 性 ， 但 是 
如 果 此 值 是 不 确定 的 ， 则 仍然 有 问题 ， 如 果 我 们 编写 下 列 代码 : 

#include <unistd.h> 

for (i = 0; i < sysconf(_SC_OPEN_MAX); i++) 

close(i); 

如 果 OPEN_MAX 是 不 确定 的 ， 那 么 for 循 环 根本 不 会 执行 ， 因 为 
sysconf 将 返回 -1。 在 这 种 情况 下 ， 最 好 的 选择 就 是 关闭 所 有 描述 符 直 至 
某 个 限制 值 ( 如 256) 。 如 同上 面 的 路 径 名 实例 一 样 ， 虽 然 并 不 能 保证 
在 所 有 情况 下 都 能 正确 工作 ， 但 这 却 是 我 们 所 能 选择 的 最 好 方法 。 图 2- 
17 的 程序 中 使 用 了 这 种 技术 。 






































我 们 可 以 耐心 地 调用 close， 直 至 得 到 一 个 出 错 返 回 ， 但 是 从 
close (EBADF) 出 错 返 回 并 不 区 分 无 效 描述 符 和 没有 打开 的 描述 符 。 
如 果 使 用 此 技术 ， 而 且 描 述 符 9 RIF, WERF 10 打 开 了 ， 那 么 将 停 
止 在 9 上 ， 而 不 会 关闭 10。dup 函 数 〈 见 3.12 节 ) 在 超过 了 OPEN_MAX 时 
确实 会 返回 一 个 特定 的 出 错 值 ， 但 是 用 复制 一 个 描述 符 两 、 三 百 次 的 方 








法 来 确定 此 值 是 一 种 非常 极端 的 方法 。 


finclude "apue.h" 
include <errno.h> 
tinclude <limits.h> 


ifdef OPEN MAX 

static long openmax = OPEN MAX; 
telse 

static long openmax = 0; 

fendif 


/* 

* If OPEN MAX is indeterminate, this might be inadequate. 
Sy 

Hdefine OPEN MAX GUESS 256 


long 
open max (void) 
| 
if (openmax == 0) { /* first time through */ 
errno = 0; 


if ((openmax = sysconf( SC OPEN MAX)) < 0) { 
if (errno == 0) 
openmax = OPEN MAX GUESS; /* it's indeterminate */ 
else 
err sys("sysconf error for SC OPEN MAX"); 


return (openmax) ; 





图 2-17 确定 文件 描述 符 个 数 

某 些 实现 返回 LONG_MAX 作为 限制 值 ， 但 这 与 不 限制 其 值 在 效果 
上 是 相同 的 。Linux 对 ATEXIT_MAX 所 取 的 限制 值 就 属于 此 种 情况 〈 见 
， 这 将 使 程序 的 运行 行为 变 得 非常 糟糕 ， 因 此 并 不 是 一 个 好 方 
ae 

例如 ， 我 们 可 以 使 用 Bourne-again shell 的 内 建 命令 ulimit 来 更 改进 程 
可 同时 打开 文件 的 最 多 个 数 。 如 果 要 将 此 限制 值 设置 为 在 效果 上 是 无 限 
制 的 ， 那 么 通常 要 求 具 有 特权 《超级 用 户 ) 。 但 是 ， 一 旦 将 其 值 设置 为 
无 穷 大 ，sysconf 就 会 将 LONG_MAX 作 为 OPEN_MAX 的 限制 值 报告 。 程 
序 知 将 此 值 作 为 要 关闭 的 文件 描述 符 数 的 上 限 《 如 图 2-17 所 示 ) , HBA 
为 了 试图 关闭 2 147 483 647-3007 IA, WIR SAT Tal, Sein 
其 中 绝 大 多 数 文件 描述 符 并 未 得 到 使 用 。 

支持 Single UNIX Specification 中 XSI 扩 展 的 系统 提供 了 getrlimit(2) 函 
数 〈 见 7.11 节 ) 。 它 返回 一 个 进程 可 以 同时 打开 的 描述 符 的 最 多 个 数 。 
使 用 该 函数 ， 我 们 能 够 检测 出 对 于 进程 能 够 打开 的 文件 数 实际 上 并 没有 
设置 上 限 ， 于 是 也 就 避 开 了 这 个 问题 。 

OPEN_MAX 被 POSIX 称 为 运行 时 不 变 值 ， 这 意味 着 在 一 个 进程 的 
生命 周期 中 其 值 不 应 发 生变 化 。 但 是 在 支持 XSI 扩 展 的 系统 上 ， 可 以 调 
用 setrlimit(2) 函 数 〈 见 7.11 节 ) 更 改 一 个 运行 进程 的 OPEN_MAX 值 (也 
可 用 C shell 的 limit 或 Bourne shell, Bourne-again shell, Debian Almquist 
和 Korn shell 的 ulimit 命 令 更 改 这 个 值 ) 。 如 果 系 统 支 持 这 种 功能 ， 则 可 
以 更 改 图 2-17 中 的 函数 ， 使 得 每 次 调用 此 函数 时 都 会 调用 sysconf， 而 不 
只 是 在 第 一 次 调用 此 函数 时 调用 sysconf。 























2.6 这 项 


图 2-5 列 出 了 POSIX.1 的 选项 ， 并 且 2.2.3 节 讨论 了 XSI 的 选项 组 。 如 
果 我 们 要 编写 可 移植 的 应 用 程序 ， 而 这 些 程序 可 能 会 依赖 于 这 些 可 选 的 
a 那么 就 需要 一 种 可 移植 的 方法 来 判断 实现 是 否 支 持 一 个 给 
定 的 选项 。 
u a ( 见 2.5 节 ) 一 样 ，POSIX.1 定 义 了 3 种 处 理 选 项 
TTI 

C1) 编译 时 选项 定义 在 <unistd.h> 中 。 

(2) 与 文件 或 目录 无 关 的 运行 时 选项 用 sysconf 函 数 来 判断 。 

(3) 与 文件 或 目录 有 关 的 运行 时 选项 通过 调用 pathconf 或 fpathconf 
函数 来 判断 。 

选项 包括 了 图 2-5 中 第 3 列 的 符号 以 及 图 2-19 和 图 2-18 中 的 符号 。 如 
果 符 号 各 量 未 定义 ， 则 必须 使 用 sysconf、pathconf 或 fpathconf 来 判断 是 
否 支 持 该 选项 。 在 这 种 情况 下 ， 这 些 函 数 的 name 参 数 前 级 _POSIX 必 须 
替换 为 _ SC 或 PC。 对 于 以 _XOPEN 为 前 绥 的 常量 ， 在 构成 name 参 数 时 
必须 在 其 前 放置 _SC 或 _ PC。 例 如 ， 若 常量 POSIX_RAW_THREADS 是 
未 定义 的 ， 那 么 就 可 以 将 name 参 数 设 置 为 SC_RAW_THREADS， 并 以 
此 调用 sysconf 来 判断 该 平台 是 否 支持 POSIX 线 程 选项 。 如 若 常量 
_XOPEN_UNIX 是 未 定义 的 ， 那 么 就 可 以 将 name 参 数 设 置 为 
_SC_XOPEN_UNIX， 并 以 此 调用 sysconf 来 判断 该 平台 是 否 支持 XSI 扩 


对 于 每 一 个 选项 ， 有 以 下 3 种 可 能 的 平台 文 持 状态 。 

(1) 如 果 符 号 常量 没有 定义 或 者 定义 值 为 -1， 那 么 该 平台 在 编译 
时 并 不 支持 相应 选项 。 但 是 有 一 种 可 能 ， 即 在 已 文 持 该 选项 的 新 系统 上 
运行 老 的 应 用 时 ， 即 使 该 选项 在 应 用 编译 时 未 被 文 持 ， 但 如 今 新 系统 运 
行 时 检查 会 显示 该 选项 已 被 文 持 。 

(2) 如 果 符 号 常量 的 定义 值 大 于 0， 那 么 该 平台 文 持 相应 选项 。 

(3) 如 果 符 号 常量 的 定义 值 为 0， 则 必须 调用 sysconf、pathconf 或 
fpathconf 来 判断 相应 选项 是 否 受 到 支持 。 

图 2-18 总 结 了 pathconf 和 fpathconf 使 用 的 符号 常量 。 除 了 图 2-5 中 列 
出 的 选项 之 外 ， 图 2-19 总 结 了 其 他 一 些 sysconf 使 用 的 未 弃 用 的 选项 及 它 
们 的 符号 常量 。 注 意 ， 我 们 省 略 了 与 实用 命令 相关 的 选项 。 


























“POSIX CHOWN RESTRICTED | 使 用 chown 是 否 是 受 限 的 “PC CHOWN RESTRICTED 
POSIX NO TRUNC 路 径 名 长 于 NAME MAX 是 否 出 错 pC NO TRUNC 
POSIX VDISABLE 着 定义 ， 可 用 此 什 禁 用 终 站 特殊 字符 | PC VDISABLE 


_POSIX_ASYNC I0 对 相关 联 的 文件 是 天 可 以 使 用 异步 JO 。 | _PC_ASYNC_I0 
_POSIX_PRIO I0 对 相关 联 的 文件 是 谷 可 以 使 用 优先 的 WO | PC_PRIO_IO 
_POSIX_SYNC_I0 对 相关 联 的 文件 是 天 可 以 使 用 同步 JO。 | _pc_sYNc_I0 
_POSIX2 SYMLINKS 目录 中 是 奉 支 持 符号 链接 PC 2 SYMLINKS 


图 2-18 pathconf 和 fpathconf 的 选项 及 name 参 数 
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此 实现 是 从 支持 定时 中 
POSIX. 版 本 


此 实现 是 省 支 持 XSI 加 密 可 
选 组 


_POSIX_ASYNCHRONOUS_I0 
_POSIX_BARRIERS 
_POSIX_CLOCK SELECTION 
_POSIX_JOB_CONTROL 

_POSIX MAPPED FILES 
_POSIX_MEMORY PROTECTION 
_POSIX_READER WRITER LOCKS 
_POSIX_REALTIME SIGNALS 


_POSIX_SAVED_IDS 


_POSIX_SEMAPHORES 
_POSTX_SHELL 
_POSIX_SPIN_LOCKS 
_POSIX_THREAD SAFE FUNCTIONS 
_POSIX_THREADS 


_POSIX_TIMEOUTS 


_POSIX_TIMERS 
_POSIX_VERSION 


_XOPEN_CRYPT 


_SC_ASYNCHRONOUS_1I0 
_SC_BARRIERS 
_SC_CLOCK_SELECTION 
_SC_JOB_CONTROL 
_SC_MAPPED FILES 
_SC_MEMORY PROTECTION 
_SC_READER WRITER LOCKS 
_SC_REALTIME SIGNALS 


_SC_SAVED_IDS 


_SC_SEMAPHORES 


_SC_SHELL 

_SC_SPIN_ LOCKS 
_SC_THREAD SAFE FUNCTIONS 
_SC_THREADS 


_SC_TIMEOUTS 


_SC_TIMERS 


_SC_VERSION 


_SC_XOPEN CRYPT 





此 实现 是 省 支持 XSI 实时 过 
项 组 

此 实现 是 否 支 持 实 时 线程 选 
项 组 

此 实现 是 省 支持 XS] 共享 存 
储 选 项 组 


_XOPEN_REALTIME _SC_XOPEN REALTIME 


_XOPEN_REALTIME THREADS SC XOPEN REALTIME THREADS 


_XOPEN_SHM _SC_XOPEN_SHM 


_XOPEN_VERSION XSI A _SC_XOPEN_VERSION 








图 2-19 sysconf 的 选项 及 name 参 数 

如 同系 统 限制 一 样 ， 关 于 sysconf、pathconf 和 fpathconf 如 何 处 理 选 
项 ， 有 如 下 几 点 值得 注意 。 

(1) _SC_VERSION 的 返回 值 表示 标 准 发 布 的 年 (以 4 位 数 表 
示 ) 、 月 《以 2 位 数 表示 ) 。 该 值 可 能 是 198808L、199009L、199506L 
或 表示 该 标准 后 续 版 本 的 其 他 值 。 与 SUSv3 (POSIX.1 2001 年 版 ) 相 
关连 的 值 是 200112L， 与 SUSv4 (POSIX.1 2008 年 版 ) 相关 连 的 值 是 
200809L 。 

(2) _SC_XOPEN_VERSION 的 返回 值 表示 系统 支持 的 XSI 版 本 。 
与 SUSv3 相 关联 的 值 是 600， 与 SUSv4 相 关 的 值 是 700。 

(3) _SC_JOB_CONTROL. _SC_SAVED_IDS 以 及 
_PC_VDISABLE 的 值 不 再 表示 可 选 功能 。 虽 然 XPG4 和 SUS 早 期 版 本 要 
求 文 持 这 些 选项 ， 但 从 SUSv3 起 ， 不 再 需要 这 些 功能 ， 但 这 些 符号 仍然 
被 保留 ， 以 便 癌 后 兼容 。 

(4) 符合 POSIX.1-2008 的 平台 还 要 求 支持 下 列 选项 : 

* POSIX_ASYNCHRONOUS_IO 

* POSIX_BARRIERS 

+ POSIX_CLOCK_SELECTION 

* POSIX MAPPED FILES 

+ POSIX MEMORY PROTECTION 

* POSIX READER WRITER LOCKS 

»。 POSIX REALTIME SIGNALS 

«POSIX SEMAPHORES 

。POSIX_SPIN_LOCKS 

。 POSIX_THREAD SAFE FUNCTIONS 

。 POSIX_THREADS 





。POSIX_TIMEOUTS 

。POSIX_TIMERS 

这 些 常 量 定义 成 具有 值 200809L。 相 应 的 _SC 符 号 同样 是 为 了 向 后 
兼容 而 被 保留 下 来 的 。 

(5) 如 果 对 指定 的 pathname 或 fd 已 不 再 支持 此 功能 ， 那 么 
_PC_CHOWN_RESTRICTED 和 _PC_NO_TRUNC 返 回 -1， 而 errno 不 
在 所 有 符合 POSIX 的 系统 中 ， 返 回 值 将 大 于 0〈 表 示 该 选项 被 支 
F); 

(6) _PC_CHOWN_RESTRICT 引 用 的 文件 必须 是 一 个 文件 或 者 是 
一 个 目录 。 如 果 是 一 个 目录 ， 那 么 返回 值 指明 该 选项 是 否 可 应 用 于 该 目 
录 中 的 各 个 文件 。 

(7) _PC_NO_TRUNC 和 _PC 2 SYMLINKS 引 用 的 文件 必须 是 一 
个 目录 。 

(8) _PC_NO_TRUNC 的 返回 值 可 用 于 目录 中 的 各 个 文件 名 。 

(9) _PC_VDISABLE 引 用 的 文件 必须 是 一 个 终端 文件 。 

(10) _ PC _ASYNC IO、_PC_PRIO_ IO 和 _PC_SYNC IO 引用 的 文 
件 一 定 不 能 是 一 个 目录 。 

图 2-20 列 出 了 若干 配置 选项 以 及 在 本 书 所 讨论 的 4 个 示例 系统 上 的 
对 应 值 。 如 果 系 统 定 义 了 某 个 符号 常量 但 它 的 值 为 -1 或 90， 但 是 相应 的 
sysconf 或 pathconf 调 用 返回 的 是 -1， 就 表示 该 项 未 被 支持 。 可 以 看 到 ， 
有 些 系统 实现 还 没有 跟 上 Single UNIX Specification 的 最 新 版 本 。 




















限制 FreeBSD | Linux | MacOSX ETT 1 
80 | 320 | 1068 ; 
en PCES X Bd 


E en 12 


Bi y 

_POSIX_JOB_CONTROL | | 200112 
| | 
| 


—— T 
| 
_POSIX NO TRUNC 200112 | 
POSIX SAVED. IDS BYE 200112 | 

_POSTX THREADS 200112 | — 200809 200112 200112 200112 
POSIX VDISABLE 255 0 255 0 0 
POSIX VERSION 200112 | — 200809 200112 200112 200112 
_XOPEN UNIX KXN | | | | 
XOPEN_VERSION Bi 700 600 600 600 





图 2-20 配置 选项 的 实例 
注意 ， 当 用 于 Solaris PCFS 文 件 系统 中 的 文件 时 ， 对 于 
_PC_NO_TRUNC，pathconf 返 回 -1。PCFS 文 件 系 统 支 持 DOS 格 式 ( 软 
盘 格 式 ) ，DOS 文 件 名 按 DOS 文 件 系 统 所 要 求 8.3 格 式 截断 ， 在 进行 此 
种 操作 时 并 无 任何 提示 。 





2.7 功能 测试 宏 


如 前 所 述 ， 头 文件 定义 了 很 多 POSIX.1 和 和 XSI 符号。 但 是 除了 
POSIX.1 和 XSI 定 义 外 ， 大 多 数 实现 在 这 些 头 文件 中 也 加 入 了 它们 自己 
的 定义 。 如 果 在 编译 一 个 程序 时 ， 和 希望 它 只 与 POSIX 的 定义 相关 ， 而 不 
与 任何 实现 定义 的 常量 冲突 ， 那 么 就 需要 定义 常量 
_POSIX_C_SOURCE。 一 旦 定义 了 _POSIX_C_SOURCE， 所 有 POSIX.1 
头 文件 都 使 用 此 常量 来 排除 任何 实现 专 有 的 定义 。 

POSIX.1 标 准 的 早期 版 本 定义 了 _POSIX_SOURCE 常 量 。 在 POSIX.1 
的 2001 版 中 ， 它 被 蔡 换 为 POSIX_C_SOURCE。 

常量 POSIX_C_SOURCE 及 _XOPEN_SOURCE 被 称 为 功能 测试 宏 
(feature test macro) 。 有 所 有 功能 测试 宏 都 以 下 划 线 开始 。 当 要 使 用 它们 
时 ， 通 常 在 cc 命令 行 中 以 下 列 方式 定义 : 

cc -D_POSIX_C_SOURCE=200809L file.c 

这 使 得 C 程 序 在 包括 任何 头 文件 之 前 ， 定 义 了 功能 测试 安 。 如 果 我 
们 仅 想 使 用 POSIX.1 定 义 ， 那 么 也 可 将 源 文 件 的 第 一 行 设 置 为 : 

#define_POSIX_C_SOURCE 200809L 

为 使 SUSv4 的 XSI 选 项 可 由 应 用 程序 使 用 ， 需 将 常量 
_XOPEN_SOURCE 定 义 为 700。 除 了 让 XSI 选 项 可 用 以 外 ， 就 POSIX.1 的 
功能 而 言 ， 这 与 将 POSIX_C_SOURCE 定 义 为 200809L 的 作用 相同 。 

SUS 将 c99 实 用 程序 定义 为 C 编 译 环境 的 接口 。 随 之 ， 就 可 以 用 如 下 
方式 编译 文件 : 

c99 -D_XOPEN_SOURCE=700 file.c —o file 

可 以 使 用 -std=c99 选 项 在 gcc 的 C 编 译 器 中 启用 1999 ISO CH ie, un 
下 所 示 : 

gcc -D_XOPEN_SOURCE=700 -std=c99 file.c -o file 




















2.8 基 统 数 据 类 型 


历史 上 ， 某 些 UNIX 系 统 变 量 已 与 某 些 C 数 据 类 型 联系 在 一 起 ， 例 
如 ， 历 史上 主 、 次 设备 号 存放 在 一 个 16 位 的 短 整 型 中 ，8 位 表示 主 设 备 
号 ， 另 外 8 位 表示 次 设备 号 。 但 是 ， 很 多 较 大 的 系统 需要 用 多 于 256 个 值 
来 表示 其 设备 号 ， 于 是 ， 就 需要 一 种 不 同 的 技术 。 【实际 上 ，Solaris 用 
32 位 表示 设备 号 : 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。) 

头 文 件 <sys/types.h> 中 定义 了 某 些 与 实现 有 关 的 数据 类 型 ， 它 们 被 
称 为 基本 系统 数据 类 型 (primitive system data type) 。 还 有 很 多 这 种 数 
据 类 型 定义 在 其 他 头 文 件 中 。 在 头 文件 中 ， 这 些 数据 类 型 都 是 用 C 的 
typedef 来 定义 的 。 它 们 绝 大 多 数 都 以 _t 结 尾 。 图 2-21 列 出 了 本 书 将 使 用 
的 一 些 基 本 系统 数据 类 型 。 

用 这 种 方式 定义 了 这 些 数 据 类 型 后 ， 束 不 再 需要 考虑 因 系 统 不 同 而 
变化 的 程序 实现 细节 。 在 本 书 中 涉及 这 些 数据 类 型 时 ， 我 们 会 说 明 为 什 
么 要 使 用 它们 。 








clockt 时 钟 滴答 计数 器 (进程 时 间 ) (1.10 节 ) 

comp t 压缩 的 时 钟 滴答 (POSIX.1 未 定义 ，8.14 节 ) 
dev t 设备 号 (EMK) (4.244) 

fd_set 文件 描述 符 集 (14.4.1 节 ) 

fpos t 文件 位 置 (5.10 节 ) 

gid t 数值 组 ID 

ino t i 节点 编号 《4.14 节 ) 

mode_t 文件 类 型 ， 文 件 创建 模式 (4.5 A) 

nlink t 目录 项 的 链接 计数 (4.14 节 ) 

off t 文件 长 度 和 偏 移 量 ( 带 符号 的 ) (seek, 3.6 Wi) 
pid t 进程 ID 和 进程 组 ID (市 符号 的 ) (8.2 和 9.4 节 ) 
pthread t 线程 ID (11.3 节 ) 

ptrdiff t 两 个 指针 相 减 的 结果 〈 带 符号 的 ) 

flim t 资源 限制 (7.11 节 ) 

sig atomic t | 能 原子 性 地 访问 的 数据 类 型 (10.15 节 ) 

sigset t 信号 集 (10.11 节 ) 

size t 对 象 〈 如 字符 串 ) KE (不 带 符 号 的 ) (3.7 节 ) 
ssize t 返回 字 节 计数 的 函数 ( 带 符 号 的 ) (read, write, 3.7 1) 
time t 日 历时 间 的 秒 计数 器 (1.10 节 ) 

uid t 数值 用 户 ID 

wchar t 能 表示 所 有 不 同 的 字符 码 


图 2-21 一 些 常用 的 基本 系统 数据 类 型 





2.9 标准 之 加 的 冲突 


就 整体 而 言 ， 这 些 不 同 的 标准 之 间 配 合 得 相当 好 。 因 为 SUS 基本 
说 明和 POSIX.1 是 同一 个 东西 ， 所 以 我 们 不 对 它们 进行 特别 的 说 明 ， 我 
们 主要 关注 ISO “C 标 准 和 POSIX.1 之 间 的 差别 。 它 们 之 间 的 冲突 并 非 有 
意 ， 但 如 果 出 现 冲突 ，POSIX.1 服 从 ISO C 标 准 。 然 而 它们 之 间 还 是 存在 
着 一 些 差别 的 。 

ISO ”CC 定义 了 dock 函 数 ， 它 返回 进程 使 用 的 CPU 时 间 ， 返 回 值 是 
clock_t 类 型 值 ， 但 ISO C 标准 没有 规定 它 的 单位 。 为 了 将 此 值 变 换 成 以 
秒 为 单位 ， 需 要 将 其 除 以 在 <time.h> 头 文件 中 定义 的 
CLOCKS_PER_SEC。POSIX.1 定 义 了 times 函 数 ， 它 返回 其 调用 者 及 其 
所 有 终止 子 进程 的 CPU 时 间 以 及 时 钟 时 间 ， 所 有 这 些 值 都 是 clock t 类 
型 值 。sysconf ”函数 用 来 获得 每 秒 滴 答 数 ， 用 于 表示 times 函 数 的 返回 
值 。ISO  C 和 POSIX.1 用 同一 种 数据 类 型 (clock_t) 来 保存 对 时 间 的 测 
量 ， 但 定义 了 不 同 的 单位 。 这 种 差别 可 以 在 Solaris 中 看 到 ， 其 中 clock 返 
回 微 秒 数 〈CLOCK_PER_SEC 是 100 万 ) ， 而 sysconf 为 每 秒 滴答 数 返 回 
的 值 是 100。 因 此 ， 我 们 在 使 用 clock_t 类 型 变量 的 时 候 ， 必 须 十 分 小 心 
以 免 泥 涌 不 同 的 时 间 单 位 。 

另 一 个 可 能 产生 冲突 的 地 方 是 : 在 ISO ”CC 标准 说 明 函 数 时 ， 可 能 没 
有 像 POSIX.1 那 样 严 。 在 POSIX 环 境 下 ， 有 些 函 数 可 能 要 求 有 一 个 与 C 环 
境 下 不 同 的 实现 ， 因 为 POSIX 环 境 中 有 多 个 进程 ， 而 ISO”C 环 境 则 很 少 
考虑 宿主 操作 系统 。 尽 管 如 此 ， 很 多 符合 POSIX 的 系统 为 了 兼容 性 也 会 
实现 ISO C 函 数 。signal 函 数 就 是 一 个 例子 。 如 果 在 不 了 解 的 情况 下 使 用 
了 Solaris 提 供 的 signal 函 数 〈 和 希望 编写 可 在 ISO C 环 境 和 较 早 UNIX 系 统 中 
运行 的 可 兼容 程序 ) ， 那 么 它 提供 了 与 POSIX.1 sigaction 函 数 不 同 的 语 
义 。 第 10 章 将 对 signal 函 数 做 更 多 说 明 。 








2.10 小 结 


在 过 去 25 年 多 的 时 间 里 ，UNIX 编 程 环 境 的 标准 化 已 经 取得 了 很 大 
进展 。 本 章 对 3 个 主要 标准 一 一 ISO C、POSIX 和 Single UNIX 
Specification 进 行 了 说 明 ， 也 分 析 了 这 些 标 准 对 本 书 主要 关注 的 4 个 实 
现 ， 即 FreeBSD、Linux、Mac OS X 和 Solaris 所 产生 的 影响 。 这 些 标准 都 
试图 定义 一 些 可 能 随 实现 而 更 改 的 参数 ， 但 是 我 们 已 经 看 到 这 些 限制 并 
不 完美 。 本 书 将 涉及 很 多 这 些 限制 和 约 种 量 。 

在 本 书 最 后 的 参考 书目 中 ， 说 明了 如 何 获得 这 些 标准 的 方法 。 




















习题 





2.1 ， 在 2.8 节 中 提 到 一 些 基 本 系统 数据 类 型 可 以 在 多 个 头 文件 中 定 
义 。 例 如 ， 在 FreeBSD 8.0 中 ， size_t 在 29 个 不 同 的 头 文件 中 都 有 定义 。 
由 于 一 个 程序 可 能 包含 这 29 个 不 同 的 头 文件 ， 但 是 ISO C 却 不 允许 对 同 
一 个 名 字 进 行 多 次 typedef， 那 么 如 何 编写 这 些 头 文件 呢 ? 

2.2 ”检查 系统 的 头 文件 ， 列 出 实现 基本 系统 数据 类 型 所 用 到 的 实际 
数据 类 型 。 

2.3 ”改写 图 2-17 中 的 程序 ， 使 其 在 sysconf 为 OPEN_MAX 限 制 返 回 
LONG_MAX 了 时， 避免 进行 不 必要 的 处 理 。 





a1 引言 


本 章 开 始 讨 论 UNIX 系 统 ， 先 说 明 可 用 的 文件 VO 函数 一 一 打开 文 
件 、 旋 文件 、 写 文件 等 。UNIX 系 统 中 的 大 多 数 文件 UO 只 需 用 到 5 个 函 
数 : open、read、write、lseek 以 及 close。 然 后 说 明 不 同 缓冲 长 度 对 read 
和 write 函数 的 影响 。 

本 章 摘 述 的 函数 经 党 被 称 为 不 训 绥 冲 的 IO Cunbuffered IJO， 与 将 
在 第 5 章 中 说 明 的 标准 IO 函数 相对 照 ) 。 术 语 不 融 缓 冲 指 的 是 每 个 read 
和 write 都 调用 内 核 中 的 一 个 系统 调用 。 这 些 不 市 绥 冲 的 MO 机 数 不 是 ISO 
C 的 组 成 部 分 ， 但 是 ， 它 们 是 POSIX.1 和 Single UNIX Specification 的 组 成 
We 

只 要 涉及 在 多 个 进程 间 共享 资源 ， 原 子 操作 的 概念 就 变 得 非常 重 
要 。 我 们 将 通过 文件 MO 和 open 函 数 的 参数 来 讨论 此 概念 。 然 后 ， 本 章 
将 进一步 讨论 在 多 个 进程 间 如 何 共 享 文件 ， 以 及 所 涉及 的 内 核 有 关 数 据 
结构 。 在 描述 了 这 些 特征 后 ， 将 说 明 dup、fcntl、sync、fsync 和 ioctl 函 














3.2 SCE THIN IT 


对 于 内 核 而 言 ， 所 有 打开 的 文件 都 通过 文件 描述 符 引 用 。 文 件 描述 
符 是 一 个 非 负 整数 。 当 打开 一 个 现 有 文件 或 创建 一 个 新 文件 时 ， 内 核 同 
进程 返回 一 个 文件 描述 符 。 当 读 、 写 一 个 文件 时 ， 使 用 open 或 creat 返 回 
的 文件 描述 符 标识 该 文件 ， 将 其 作为 参数 传送 给 read 或 write。 

按照 惯例 ，UNIX 系 统 shell 把 文件 描述 符 0 与 进程 的 标准 输入 关联 ， 
文件 描述 符 1 与 标准 输出 关联 ， 文 件 描述 符 2 与 标准 错误 关联 。 这 是 各 种 
shell 以 及 很 多 应 用 程序 使 用 的 惯例 ， 与 UNIX 内 核 无 关 。 尽 管 如 此 ， 如 
果 不 遵循 这 种 惯例 ， 很 多 UNIX 系 统 应 用 程序 就 不 能 正常 工作 。 

在 符合 POSIX.1 的 应 用 程序 中 ， 约 数 0、1、2 虽 然 已 被 标准 化 ， 但 应 
当 把 它们 蔡 换 成 符号 常量 STDIN_FILENO、STDOUT_FILENO 和 
STDERR_FILENO 以 提高 可 读 性 。 这 些 常 量 都 在 头 文件 <unistd.h> 中 定 





文件 描述 符 的 变化 范围 是 0 一 OPEN_MAX-1 ( 见 图 2-11) 。 早 期 的 
UNIX 系 统 实现 采用 的 上 限 值 是 19〈 人 允许 每 个 进程 最 多 打开 20 个 文 
件 ) ， 但 现在 很 多 系统 将 其 上 限 值 增加 至 63。 

对 于 FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8 以 及 Solaris 10, X 
件 描述 符 的 变化 范围 几乎 是 无 限 的 ， 它 只 受到 系统 配置 的 存储 器 总 量 、 
整 型 的 字 长 以 及 系统 管理 员 所 配置 的 软 限 制 和 硬 限 制 的 约束 。 





3.3 Ki ZV open#il openat 


Val H open=Kopenatek 2 FY UH FP Bk EBS SCF 

#include <fcntl.h> 

int open(const char *path, int oflag,... /* mode_t mode */); 

int openat(int f d, const char *path, int oflag, ... /* mode_t mode */ ); 

两 函数 的 返回 值 ， 帮 成功， 返回 文件 摘 述 得， 大 出 错 ， 返 回 -1 

我 们 将 最 后 一 个 参数 写 为 ...，ISO C 用 这 种 方法 表明 余下 的 参数 的 
数量 及 其 类 型 是 可 变 的 。 对 于 open 函 数 而 言 ， 仪 当 创建 新 文件 时 才 使 用 
ee 
TERE o 

path 参 数 是 要 打开 或 创建 文件 的 名 字 。oflag 参 数 可 用 来 说 明 此 函数 
的 多 个 选项 。 用 下 列 一 个 或 多 个 常量 进行 “或 ?运算 构成 oflag 参 数 〈 这 些 
常量 在 头 文件 <fcntl.h> 中 定义 〉。 


O RDONLY 只 读 打 开 。 
O WRONLY 只 写 打 开 。 
O_RDWR 读 、 写 打开 。 


大 多 数 实现 将 O_RDONLY 定 义 为 0，O_WRONLY 定 义 为 1， 
O_RDWR 定 义 为 2， 以 与 早期 的 程序 兼容 。 

O_EXEC 只 执行 打开 。 

O_SEARCH 只 搜索 打开 〈 应 用 于 目录 ) 。 

O_SEARCH 和 常量 的 目的 在 于 在 目录 打开 时 验证 它 的 搜索 权限 。 对 目 
录 的 文件 描述 符 的 后 续 操 作 就 不 需要 再 次 检查 对 该 目录 的 搜索 权限 。 本 
书 中 涉及 的 操作 系统 目前 都 没有 文 持 O_SEARCH。 
在 这 5 个 常量 中 必须 指定 一 个 且 只 能 指定 一 个 。 下 列 常 量 则 是 可 选 











和 O_APPEND 每 次 写 时 都 退 加 到 文件 的 尾 端 。3.11 节 将 详细 说 明 此 选 
项 。 

O_CLOEXEC 把 FD_CLOEXEC 常 量 设置 为 文件 描述 符 标 志 。3.14 
节 中 将 说 明文 件 摘 述 符 标 志 。 

O_CREAT 知 此 文件 不 存在 则 创建 它 。 使 用 此 选项 时 ，open 函 数 需 
同时 说 明 第 3 个 参数 mode (Copenat 函 数 需 说 明 第 4 个 参数 mode) ， 用 
mode 指 定 该 新 文件 的 访问 权限 位 (4.5 节 将 说 明文 件 的 权限 位 ， 那 时 就 
能 了 解 如 何 指定 mode， 以 及 如 何 用 进程 的 umask 值 修改 它 ) 。 











O_DIRECTORY 如 果 path 引 用 的 不 是 目录 ， 则 出 错 。 

O_EXCL 如 果 同 时 指定 了 O_CREAT， 而 文件 已 经 存在 ， 则 出 错 。 
用 此 可 以 测试 一 个 文件 是 否 存在 ， 如 果 不 存在 ， 则 创建 此 文件 ， 这 使 测 
试 和 创建 两 者 成 为 一 个 原子 操作 。3.11 节 将 更 详细 地 说 明 原 子 操作 。 

O_NOCTTY 如 果 path 引 用 的 是 终端 设备 ， 则 不 将 该 设备 分 配 作 为 
此 进程 的 控制 终端 。9.6 节 将 说 明 控 制 终端 。 

O_NOFOLLOW 如 果 path 引 用 的 是 一 个 符号 链接 ， 则 出 错 。4.17 节 
将 说 明 符 号 链接 。 

O_NONBLOCK 如 果 path 引 用 的 是 一 个 FIFO、 一 个 块 特殊 文件 或 一 
个 字符 特殊 文件 ， 则 此 选项 为 文件 的 本 次 打开 操作 和 后 续 的 IO 操作 设 
置 非 阻塞 方式 。14.2 节 将 说 明 此 工作 模式 。 

较 早 的 System V 引 入 了 O_NDELAY (不 延迟 ) 标志 ， 它 与 
O_NONBLOCK (PHE) 选项 类 似 ， 但 它 的 读 操 作 返 回 值 具有 二 义 
性 。 如 果 不 能 从 管道 、FIFO 或 设备 读 得 数据 ， 则 不 延迟 选项 使 read 返 回 
0， 这 与 表示 已 读 到 文件 尾 端的 返回 值 0 冲突 。 基 于 SVR4 的 系统 仍 支 持 
这 种 语义 的 不 延迟 选项 ， 但 是 新 的 应 用 程序 应 当 使 用 不 阻塞 选项 代替 
Ze 











O_SYNC 使 每 次 write 等 待 物理 MO 操作 完成 ， 包 括 由 该 
write 操作 引起 的 文件 属性 更 新 所 需 的 MO。3.14 节 将 使 用 此 选项 。 
O_TRUNC 如 果 此 文件 存在 ， 而 且 为 只 写 或 读 -写成 功 打 


开 ， 则 将 其 长 度 截 断 为 0。 

O_TTY_INIT 如 果 打 开 一 个 还 未 打开 的 终端 设备 ， 设 置 非 标准 
termios 参数 值 ， 使 其 符合 Single UNIX Specification。 第 18 章 将 讨论 终端 
LO 的 termios 结 构 。 

下 面 两 个 标志 也 是 可 选 的 。 它 们 是 Single UNIX Specification (以 及 
POSIX.1) 中 同步 输入 和 输出 选项 的 一 部 分 。 

O_DSYNC ， ”使 每 次 write 要 等 待 物理 IO 操作 完成 ， 但 是 如 果 该 写 操 
作 并 不 影响 读 取 刚 写 入 的 数据 ， 则 不 需 等 待 文件 属性 被 更 新 。 

O_DSYNC 和 O_SYNC 标志 有 微妙 的 区 别 。 仅 当 文 件 属 性 需要 更 
新 以 反映 文件 数据 变化 〈 例 如 ， 更 新 文件 大 小 以 反映 文件 中 包含 了 更 多 
的 数据 ) 时 ，O_DSYNC 标 志 才 影响 文件 属性 。 而 设置 O0_SYNC 标 志 
后 ， 数 据 和 属性 总 是 同步 更 新 。 当 文件 用 O_DSYN 标 志 打 开 ， 在 重 写 其 
现 有 的 部 分 内 容 时 ， 文 件 时 间 属 性 不 会 同步 更 新 。 与 此 相反 ， 如 果 文 件 
是 用 O_SYNC 标 志 打 开 ， 那 么 对 访 文 件 的 每 一 次 write 都 将 在 write 返回 前 
更 新 文件 时 间 ， 这 与 是 否 改写 现 有 字 节 或 追加 写 文件 无 关 。 

O_RSYNC 使 每 一 个 以 文件 描述 符 作 为 参数 进行 的 read 操 
作 等 待 ， 直 至 所 有 对 文件 同一 部 分 挂 起 的 写 操 作 都 完成 。 























Solaris 10 支持 所 有 这 3 个 标志 。FreeBSD (和 Mac OS X) 设置 了 
另外 一 个 标志 〈O_FSYNC) ， 它 与 标志 O_SYNC 的 作用 相同 。 因 为 这 
两 个 标志 是 等 效 的 ， 它 们 定义 的 标志 具有 相同 的 值 。FreeBSD 8.0453 
持 O_DSYNC 或 O RSYNC 标 志 。Mac OS X 并 不 支持 O_RSYNC， 但 却 定 
义 了 O_DSYNC， 处 理 O_DSYNC 与 处 理 O_SYNC 相 同 。Linux 3.2.0 定 义 
了 O_DSYNC， 但 处 理 O_RSYNC 与 处 理 O_SYNC 相 同 。 

由 open 和 openat 函 数 返 回 的 文件 描述 符 一 定 是 最 小 的 未 用 描述 符 数 
值 。 这 一 点 被 某 些 应 用 程序 用 来 在 标准 输入 、 标 准 输 出 或 标准 错误 上 打 
开 新 的 文件 。 例 如 ， 一 个 应 用 程序 可 以 先 关 闭 标 准 输出 《通常 是 文件 描 
述 符 1) ， 然 后 打开 另 一 个 文件 ， 执 行 打开 操作 前 就 能 了 解 到 该 文件 一 
定 会 在 文件 描述 符 1 上 打开 。 在 3.12 节 说 明 dup2 函 数 时 ， 可 以 了 解 到 有 
更 好 的 方法 来 保证 在 一 个 给 定 的 描述 符 上 打开 一 个 文件 。 

fd 参数 把 open 和 openat 函 数 区 分 开 ， 共 有 3 种 可 能 性 。 

(1) path 人 参数 指定 的 是 绝对 路 径 名 ， 在 这 种 情况 下 ，f 人 fa 参数 被 久 
Ms, openat 20x44 F open K% 

(2) path 参 数 指定 的 是 相对 路 径 名 ，fd 参 数 指出 了 相对 路 径 名 在 文 
E E 


(3) path 参 数 指定 了 相对 路 径 名 ，fq 参 数 具 有 特殊 值 
AT_FDCWD。 在 这 种 情况 下 ， 路 径 名 在 当前 工作 目录 中 获取 ，openat 函 
数 在 操作 上 与 open 函 数 类 似 。 

openat 函 数 是 POSIX.1 最 新 版 本 中 新 增 的 一 类 函数 之 一 ， 和 希望 解决 
两 个 问题 。 第 一 ， 让 线程 可 以 使 用 相对 路 径 名 打开 目录 中 的 文件 ， 而 不 
再 只 能 打开 当前 工作 目录 。 在 第 11 章 我 们 会 看 到 ， 同 一 进程 中 的 所 有 
线程 共享 相同 的 当前 工作 目录 ， 因 此 很 难 让 同一 进程 的 多 个 不 同 线程 在 
同一 时 间 工 作 在 不 同 的 目录 中 。 第 二 ， 可 以 避免 time-of-check-to-time- 
of-use (TOCTTOU) ) 错误 。 

TOCTTOU 错 误 的 基本 思想 是 : 如 果 有 两 个 基于 文件 的 函数 调用 ， 
其 中 第 三 个 调用 依赖 于 第 一 个 调用 的 结果 ， 那 么 程序 是 脆弱 的 。 因 为 两 
个 调用 并 不 是 原子 操作 ， 在 两 个 函数 调用 之 间 文 件 可 能 改变 了 ， 这 样 也 
就 造成 了 第 一 个 调用 的 结果 束 不 再 有 效 ， 使 得 程序 最 终 的 结果 是 错误 
的 。 文 件 系统 命名 空间 中 的 TOCTTOU 错 误 通 常 处 理 的 就 是 那些 颠覆 文 
件 系统 权限 的 小 把 戏 ， 这 些小 把 戏 通过 骗取 特权 程序 降低 特权 文件 的 权 
限 控 制 或 者 让 特权 文件 打开 一 个 安全 漏洞 等 方式 进行 。Wei 和 Pu[2005] 
在 UNIX 文 件 系 统 接口 中 讨论 了 TOCTTOU 的 缺陷 。 

文件 名 和 路 径 名 截断 

如 果 NAME_MAX 是 14， 而 我 们 却 试图 在 当前 目录 中 创建 一 个 文件 


























名 包含 15 个 字符 的 新 文件 ， 此 时 会 发 生 什 么 昵 ? 按照 传统 ， 早 期 的 
System  V 版 本 〈 如 SVR2) 允许 这 种 使 用 方法 ， 但 总 是 将 文件 名 截断 为 
14 个 字符 ， 而 且 不 给 出 任何 信息 ， 而 BSD 类 的 系统 则 返回 出 错 状态 ， 
并 将 erno 设置 为 ENAMETOOLONG。 无 声 无 息 地 截断 文件 名 会 引起 问 
题 ， 而 且 它 不 仅仅 影响 到 创建 新 文件 。 如 果 NAME_MAX 是 14， 而 存在 
一 个 文件 名 恰好 就 是 14 个 字符 的 文件 ， 那 么 以 路 径 名 作为 其 参数 的 任 一 
函数 Copen, stat) 都 无 法 确定 该 文件 的 原始 名 是 什么 。 其 原因 是 这 
些 函 数 无 法 判断 该 文件 名 是 否 被 截断 过 。 

在 POSIX.1 中 ， 常 量 POSIX_NO_TRUNC 决 定 是 要 截断 过 长 的 文件 
名 或 路 径 名 ， 还 是 返回 一 个 出 错 。 正 如 我 们 在 第 2 章 中 已 经 见 过 的 ， 根 
据 文 件 系统 的 类 型 ， 此 值 可 以 变化 。 我 们 可 以 用 fpathconf 或 pathconf 来 
得 询 目录 具体 文 持 何 种 行为 ， 到 底 是 截断 过 长 的 文件 名 还 是 返回 出 错 。 

是 否 返回 一 个 出 错 值 在 很 大 程度 上 是 历史 形成 的 。 例 如 。 基 于 
SVR4 的 系统 对 传统 的 System  ”V 文 件 系 统 (S5) 并 不 出 错 ， 但 是 它 对 
BSD 风 格 的 文件 系统 CUFS) 则 出 错 。 作 为 另 一 个 例子 〈 参 见 图 2- 

20) ，Solaris 对 UFS 返 回 出 错 ， 对 与 DOS 兼 容 的 文件 系统 PCFS 则 不 返回 
出 错 ， 其 原因 是 DOS 会 无 声 无 娠 地 截断 不 匹配 8.3 格 式 的 文件 名 。BSD 类 
系统 和 Linux 总 是 会 返回 出 错 。 

荷 _ POSIX_ NO_TRUNC 有 效 ， 则 在 整个 路 径 名 超过 PATH _MAX， 
或 路 径 名 中 的 任 一 文件 名 超过 NAME_MAX 时 ， 出 错 返 回 ， 并 将 errno 设 
置 为 ENAMETOOLONG。 

大 多 数 的 现代 文件 系统 支持 文件 名 的 最 大 长 度 可 以 为 255。 因 为 文 
件 名 通常 比 这 个 限制 要 短 ， 因 此 对 大 多 数 应 用 程序 来 说 这 个 限制 还 未 出 
现 什 么 问题 。 


























3.4 打数 creat 


也 可 调用 creat 函 数 创建 一 个 新 文件 。 

#include <fcntl.h> 

int creat(const char *path, mode_t mode); 

返回 值 : 知 成 功 ， 返 回 为 只 写 打 开 的 文件 描述 符 ; 知 出 错 ， 返 回 -1 

注意 ， 此 函数 等 效 于 : 

open(path,O_WRONLY | O_CREAT | O_TRUNC, mode); 

在 早期 的 UNIX 系 统 版 本 中 ，open 的 第 二 个 参数 只 能 是 0、1 或 2。 无 
法 打开 一 个 尚未 存在 的 文件 ， 因 此 需要 男 一 个 系统 调用 creat 以 创建 新 文 
件 。 现 在 ，open 函 数 提供 了 选项 O_ CREAT 和 O_TRUNC， 于 是 也 就 不 再 
需要 单独 的 creat 函 数 。 

在 4.5 节 中 ， 我 们 将 详细 说 明文 件 访问 权限 ， 并 说 明 如 何 指定 
mode。 

creat 的 一 个 不 足 之 处 是 它 以 只 写 方式 打开 所 创建 的 文件 。 在 提供 
open 的 新 版 本 之 前 ， 如 果 要 创建 一 个 临时 文件 ， 并 要 先 写 该 文件 ， 然 后 
又 读 该 文件 ， 则 必须 先 调用 creat、close， 然 后 再 调用 open。 现 在 则 可 用 
下 列 方式 调用 open 实 现 : 

open(path, O_RDWR | O_CREAT | O_TRUNC, mode); 





3.5 pki 2¢close 


可 调用 close 函 数 关 闭 一 个 打开 文件 。 
#include <unistd.h> 
int close (int fd); 
返回 值 ， 铬 成功， 返回 0;， 寿 出错， 返回 -1 

关闭 一 个 文件 时 还 会 释放 该 进程 加 在 该 文件 上 的 所 有 记录 锁 。14.3 
节 将 讨论 这 一 点 。 

当 一 个 进程 终止 时 ， 内 核 上 自动 关闭 它 所 有 的 打开 文件 。 很 多 程序 都 
利用 了 这 一 功能 而 不 显 式 地 用 close 关 闭 打 开 文 件 。 实 例 见 图 1-4 程 序 。 


3.6 函数 lseek 


每 个 打开 文件 都 有 一 个 与 其 相关 联 的 “当前 文件 偏 移 量 ”(current 
file offset) 。 它 通常 是 一 个 非 负 整数 ， 用 以 度量 从 文件 开始 处 计算 的 字 
节 数 (本 节 稍 后 将 对 “ 非 负 ”这 一 修饰 词 的 某 些 例外 进行 说 明 ) 。 通 常 ， 
读 、 写 操作 都 从 当前 文件 偏 移 量 处 开始 ， 并 使 偏 移 量 增加 所 读 写 的 字 节 
数 。 按 系统 默认 的 情况 ， 当 打开 一 个 文件 时 ， 除 非 指 定 O_APPEND 选 
项 ， 盏 则 该 偏 移 量 被 设置 为 0。 

可 以 调用 lseek 显 式 地 为 一 个 打开 文件 设置 偏 移 量 。 

#include <unistd.h> 

off_t lseek(int fd, off_t offset, int whence); 

返回 值 : eI, IRI SCA as ae, 大 出 错 ， 返 回 为 -1 

对 参数 offset 的 解释 与 参数 whence 的 值 有 关 。 

* 若 whence 是 SEEK_SET， 则 将 该 文件 的 偏 移 量 设置 为 距 文件 开始 处 
offset ZT o 

* 若 whence 是 SEEK_CUR， 则 将 该 文件 的 偏 移 量 设置 为 其 当前 值 加 
offset，offset 可 为 正 或 负 。 

“各 whence 是 SEEK_END， 则 将 该 文件 的 偏 移 量 设置 为 文件 长 度 加 
offset，offset 可 正 可 负 。 

在 lseek 成 功 执行 ， 则 返回 新 的 文件 偶 移 量 ， 为 此 可 以 用 下 列 方式 确 
定 打开 文件 的 当前 偏 移 量 : 

off_t currpos; 

currpos = lseek(fd, 0, SEEK_CUR); 

TPP TT IE tH BY HRK RE TY A A SOE ES A URE AS to WMR 
件 描 述 符 指向 的 是 一 个 管道 、FIFO 或 网 络 套 接 字 ， 则 lseek 返 回 -1， 并 
将 ermo 设 置 为 ESPIPE。 

3 个 符号 常量 SEEK_SET、SEEK_CUR 和 SEEK_END 是 在 System V 
中 引入 的 。 在 System  V 之 前 ，whence 被 指定 为 ”0 绝对 偏 移 量 )〉、 
1 相对 于 当前 位 置 的 偏 移 量 ) 或 ”2 相对 文件 尾 端的 偏 移 量 ) 。 很 多 
软件 仍然 把 这 些 数字 直接 写 在 代码 里 。 

在 lseek 中 的 字符 ] 表 示 长 整 型 。 在 引入 off_t 数 据 类 型 之 前 ，offset 参 
数 和 返回 值 是 长 整 型 的 。lseek 是 在 UNIX V7 中 引入 的 ， 当 时 C 语 言 中 增 
加 了 长 整 型 (在 UNIX V6 中 ， 用 函数 seek 和 tell 提 供 类 似 功能 

实例 























图 3-1 所 示 的 程序 用 于 测试 对 其 标准 输入 能 否 设 置 仿 移 量 。 
tinclude "apue.h" 
int 
main (void) 





if (lseek (STDIN FILENO, 0, SEEK CUR) == -1) 
printf ("cannot seek\n"); 

else 
printf ("seek OK\n") ; 

exit (0); 





图 3-1 测试 标准 输入 能 人 否 被 设置 偏 移 量 

如 采用 交互 方式 调用 此 程序 ， 则 可 得 

$ ./a.out < /etc/passwd 

seek OK 

$ cat < /etc/passwd| ./a.out 

cannot seek 

$ ./a.out < /var/spool/cron/FIFO 

cannot seek 

通常 ， 文 件 的 当前 偏 移 量 应 当 是 一 个 非 负 整数 ， 但 是 ， 某 些 设备 也 
可 能 允许 负 的 偏 移 量 。 但 对 于 普通 文件 ， 其 偏 移 量 必须 是 非 负 值 。 因 为 
偏 移 量 可 能 是 钠 值 ， 所 以 在 比较 lseek 的 返回 值 时 应 当 谨 愤 ， 不 要 测试 
它 是 否 小 于 0， 而 要 测试 它 是 否 等 于 -1。 

在 Intel x86 处 理 器 上 运行 的 FreeBSD 的 设备 /dev/kmem 支 持 负 的 偏 移 
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里 。 
因为 偏 移 量 (off t) 是 带 符号 数据 类 型 〈 见 图 2-21) ， 所 以 文件 的 
最 大 长 度 会 减少 一半。 例如 ， 若 off_{t 是 32 位 整 型 ， 则 文件 最 大 长 度 是 2 
一 1 个 字 节 。 

lseek 仅 将 当前 的 文件 偏 移 量 记录 在 内 核 中 ， 它 并 不 引起 任何 IO 操 
作 。 然 后 ， 该 偏 移 量 用 于 下 一 个 读 或 写 操作 。 

文件 偏 移 量 可 以 大 于 文件 的 当前 长 度 ， 在 这 种 情况 下 ， 对 该 文件 的 
下 一 次 写 将 加 长 该 文件 ， 并 在 文件 中 构成 一 个 空洞 ， 这 一 点 是 允许 的 。 




















位 于 文件 中 但 没有 写 过 的 字 节 都 被 读 为 0。 

文件 中 的 空洞 并 不 要 求 在 磁盘 上 占用 存储 区 。 具 体 处 理 方式 与 文件 
系统 的 实现 有 关 ， 妆 定位 到 超出 文件 尾 端 之 后 写 时 ， 对 于 新 写 的 数据 需 
要 分 配 人 磁盘 块 ， 但 是 对 于 原文 件 尾 疾 和 新 开始 写 位 置 之 间 的 部 分 则 不 需 
要 分 配 磁盘 块 。 

实例 

图 3-2 所 示 的 程序 用 于 创建 一 个 具有 空洞 的 文件 。 





finclude "apue.h" 
finclude <fent1.h> 


char buf1[] = "abcdefghij"; 
char buf2[] = "ABCDEFGHIJ"; 


int 
main (void) 
| 
int fd; 


if ((fd = creat("file.hole", FILE MODE)) < 0) 
err sys("creat error"); 


if (write(fd, bufl, 10) != 10) 
err sys("bufl write error"); 
/* offset now = 10 */ 


if (lseek (fd, 16384, SEEK SET) == -1) 
err sys("lseek error"); 
/* offset now = 16384 */ 


if (write(fd, buf2, 10) != 10) 
err sys("buf2 write error"); 


/* offset now = 16394 */ 


exit (0); 





运行 该 程序 得 到 : 


$ ./a.out 

$ Is -l file.hole 检查 其 大 小 
-rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
$ od -c file.hole 观察 实际 内 容 








图 3-2 创建 一 个 具有 空洞 的 文件 
0000000abcdefghij\0\0\0\0\0\0 
0000020 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \0 \O 
米 





0040000 ABCDEFGHIJ 

0040012 

使 用 od(1) 命 令 观 察 该 文件 的 实际 内 容 。 命 令 行 中 的 -c 标 志 表 示 以 字 
符 方式 打印 文件 内 容 。 从 中 可 以 看 到 ， 文 件 中 间 的 30 个 未 写 入 字 市 都 被 
读 成 0。 每 一 行 开始 的 一 个 7 位 数 是 以 八进制 形式 表示 的 字 节 仿 移 量 。 

为 了 证 明 在 该 文件 中 确实 有 一 个 空洞 ， 将 刚 创建 的 文件 与 同样 长 度 
但 无 空洞 的 文件 进行 比较 : 

$ Is -ls file.hole file.nohole 比较 长 度 

8 -rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
20 -rw-r--r-- 1 sar 16394 Nov 25 01:03 file.nohole 

虽然 两 个 文件 的 长 度 相 同 ， 但 无 空洞 的 文件 占用 了 20 个 磁盘 块 ， 而 
具有 空洞 的 文件 只 占用 8 个 磁盘 块 。 

在 此 实例 中 调用 了 将 在 3.8 节 中 说 明 的 write 函数 。4.12 节 将 对 具有 空 
洞 的 文件 进行 更 多 说 明 。 

因为 lseek 使 用 的 偏 移 量 是 用 off_t 类 型 表示 的 ， 所 以 允许 具体 实现 根 
据 各 上 自 特定 的 平台 上 自行 选择 大 小 合适 的 数据 类 型 。 现 今 大 多 数 平台 提供 
两 组 接口 以 处 理 文件 偏 移 量 。 一 组 使 用 ”32 位 文件 偏 移 量 ， 男 一 组 则 使 
用 64 位 文件 偏 移 量 。 

Single UNIX Specification 同 应 用 程序 提供 了 一 种 方法 ， 使 其 通过 
sysconf 函 数 确 定 文 持 何 种 环境 〈 见 2.5.4 节 ) 。 图 3-3 总 结 了 定义 的 


sysconf % Œ o 




















POSIX V7_ILP32 OFF32 | ints long, 指针 和 off t MMe 32 (7 | _SC_V7_ILP32_OFF32 
POSIX V7_ILP32 OFFBIG | int、long、 指 针 类 型 是 32 位 ，off t RH | SC V7 ILp32 OFFBIG 
Bie 64 fi 


POSIX VI IP64 OFF64 | int 类 型 是 32 位 long, 指针 和 off t 类 | SC V7 Lp64 OFF64 


POSIX V7 LP64 OFFBIG | int 类 型 是 32 位 long, 指针 和 off t 类 | SC V7 LPp64 OFFBIG 
型 至 少 是 多 位 


图 3-3 sysconf 的 数据 大 小 选项 和 name 参 数 

c99 编译 器 要 求 使 用 getconf(1) 命 令 将 所 期 望 的 数据 大 小 模型 映射 为 
编译 和 链接 程序 所 需 的 标志 。 根 据 每 个 平台 支持 环境 的 不 同 ， 可 能 需要 
不 同 的 标志 和 库 。 

遗憾 的 是 ， 在 这 方面 ， 实 现 还 未 跟 上 标准 的 步伐 。 如 果 你 的 系统 没 
有 匹配 标准 的 最 新 版 本 ， 那 么 系统 还 可 能 文 持 Single UNIX Specification 
前 一 版 本 中 的 选项 名 : _POSIX_V6 ILP32_OFF32、 
_POSIX_V6 ILP32 OFFBIG、_POSIX_V6 LP64 OFF64 和 
_POSIX_V6_LP64_OFFBIG. 

为 了 避 开 这 一 点 ， 应 用 程序 可 以 将 符号 常量 FILE_OFFSET_BITS 
设置 为 64， 以 支持 64 位 偏 移 量 。 这 样 就 将 off_t 定 义 更 改 为 64 位 带 符号 整 
型 。 将 _FILE_OFFSET_BITS 符 号 常量 设置 为 32 以 支持 32 位 偏 移 量 。 但 
是 ， 应 当 注 意 的 是 ， 虽 然 本 书 讨 论 的 4 种 平台 都 支持 32 位 和 64 位 文件 偏 
移 量 ， 但 是 通过 设置 FILE_OFFSET_BITS 符 号 常量 的 值 这 种 方法 并 不 
能 保证 应 用 程序 是 可 移植 的 ， 也 有 可 能 达 不 到 预期 的 效果 。 

图 3-4 总 结 了 在 本 书 涉及 的 4 种 平台 上 ， 当 应 用 程序 没有 定义 
_FILE_OFFSET_BITS 时 ，off t 数 据 类 型 的 字 节 数 以 及 
_FILE_OFFSET_BITS 被 定义 成 32 或 64 时 ，off t 数 据 类 型 的 字 节 数 。 























_FILE OFFSET BITS {ff 


操作 系统 CPU 架构 


FreeBSD 8.0 x86 32 位 
Linux 3.2.0 x86 64 位 
Mac OS X 10.6.8 x86 64 位 
Solaris 10 SPARC 64 位 
图 3-4 不 同 平台 上 off_t 的 字 节 数 


注意 : 尽 官 可 以 实现 64 位 文件 侯 移 量 ， 但 是 能 人 否 创建 一 个 大 于 2 
GB (2* 一 1 字 节 ) 的 文件 则 依赖 于 底层 文件 系统 的 类 型 。 











3.7 肖 数 read 


调用 read 函 数 从 打开 文件 中 读数 气 。 
#include <unistd.h> 
ssize_t read(int fd, void *buf, size_t nbytes); 
返回 值 : Ma, BOSCH, WO; Abt, el- 
如 read 成 功 ， 则 返回 读 到 的 字 节 数 。 如 已 到 达 文 件 的 尾 端 ， 则 返回 


有 多 种 情况 可 使 实际 读 到 的 字 节 数 少 于 要 求 读 的 字 市 数 : 

。 读 普通 文件 时 ， 在 读 到 要 求 字 节 数 之 前 己 到 达 了 文件 尾 端 。 例 
如 ， 知 在 到 达 文 件 尾 端 之 前 有 30 个 字 节 ， 而 要 求 读 100 个 字 节 ， 则 read 
返回 30。 下 一 次 再 调用 read 时 ， 它 将 返回 0《〈 文 件 尾 端 ) 。 

。 当 从 终端 设备 读 时 ， 通 常 一 次 最 多 读 一 行 ( 第 18 章 将 介绍 如 何 改 
I 

。 当 从 网 络 读 时 ， 网 络 中 的 缓冲 机 制 可 能 造成 返回 值 小 于 所 要 求 读 
的 字 节 数 。 

* 当 从 管道 或 FIFO 读 时 ， 如 若 管 道 包 含 的 字 节 少 于 所 需 的 数量 ， 那 
么 read 将 只 返回 实际 可 用 的 字 节 数 。 

* 当 从 某 些 面 癌 记录 的 设备 〈 如 人 磁带) 读 时 ， 一 次 最 多 返回 一 个 记 

















录 。 

“ 当 一 信号 造成 中 断 ， 而 已 经 读 了 部 分 数据 量 时 。 我 们 将 在 10.5 节 进 
一 步 讨论 此 种 情况 。 读 操作 从 文件 的 当前 偏 移 量 处 开始 ， 在 成 功 返回 之 
前 ， 该 偏 移 量 将 增加 实际 读 到 的 字 节 数 。POSIX.1 从 几 个 方面 对 read 郴 
数 的 原型 做 了 和 更改。 经 典 的 原型 定义 是 : 

int read(int fd, char *buf, unsigned nbytes); 

首先 ， 为 了 与 ISO C 一 致 ， 第 2 个 参数 由 char * 改 为 void * 。 在 ISO C 
中 ， 类 型 void * 用 于 表示 通用 指针 。 

其 次 ， 返 回 值 必须 是 一 个 带 符号 整 型 〈ssize_t) ， 以 保证 能 够 返回 
正 整 数字 节 数 、0《〈 表 示 文 件 尾 端 ) 或 -1〈 出 错 ) o 

最后， 第 3 个 参数 在 历史 上 是 一 个 无 符号 整 型 ， 这 允许 一 个 16 位 的 
实现 一 次 读 或 写 的 数据 可 以 多 达 65 534 个 字 节 。 在 1990 POSIX.1 标准 
中 ， 引 入 了 新 的 基本 系统 数据 类 型 ssize_t 以 提供 带 符号 的 返回 值 ， 不 带 
符号 的 Size_t 则 用 于 第 3 个 参数 〈 见 2.5.2 节 中 的 SSIZE_MAX 常 量 ) 。 











3.8 K 2 write 


调用 write 函数 癌 打 开 文 件 写 数据 。 

#include <unistd.h> 

ssize_t write(int fd, const void *buf, size_t nbytes); 

返回 值 : 知 成 功 ， 返 回 已 写 的 字 节 数 ; Aue, e- 

其 返回 值 通常 与 参数 nbytes 的 值 相同 ， 人 否则 表示 出 错 。write 出 错 的 

一 个 常见 原因 是 磁盘 已 写 满 ， 或 者 超过 了 一 个 给 定 进程 的 文件 长 上 度 限制 
( 见 7.11 节 及 习题 10.11) 。 

对 于 普通 文件 ， 与 操作 从 文件 的 当前 偶 移 量 处 开始 。 如 果 在 打开 该 
文件 时 ， 指 定 了 O_APPEND 选 项 ， 则 在 每 次 写 操 作 之 前 ， 将 文件 偏 移 量 
e 当前 结尾 处 。 在 一 次 成 功 写 之 后 ， 该 文件 偏 移 量 增加 实际 
写 的 字 节 数 。 








3.9 VON 
图 3-5 程 序 只 使 用 read 和 write 函数 复制 一 个 文件 。 


finclude "apue ,hy 
#define BUFFSIZE 4096 


int 
main(void) 
| 
int nm) 
char buflBUFFSI2ZE] ， 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT FILENO, buf, n) != n) 
err sys("write error"); 


if (n < 0) 
err sys("read error"); 


exit(0); 


图 3-5 将 标准 输入 复制 到 标准 输出 
关于 该 程序 应 注意 以 下 几 点 。 
" 它 从 标准 输入 读 ， 写 罕 标准 输出 ， 这 束 假 定 在 执行 本 程序 之 前 ， 
这 些 标准 输入 、 输 出 已 由 shell 安 排 好 。 确 实 ， 所 有 第 用 的 UNIX 系 统 





shell 都 提供 一 种 方法 ， 它 在 标准 输入 上 打开 一 个 文件 用 于 读 ， 在 标准 输 
出 上 创建 (或 重 写 ) 一 个 文件 。 这 使 得 程序 不 必 打 开 输 入 和 输出 文件 ， 
并 人 允许 用 户 利用 shell 的 1/O 重 定向 功能 。 

考虑 到 进程 终止 时 ，UNIX 系 统 内 核 会 关闭 进程 的 所 有 打开 的 文件 
描述 符 ， 所 以 此 程序 并 不 关闭 输入 和 输出 文件 。 

“对 UNIX 系统 内 核 而 言 ， 文 本 文件 和 二 进 制 代码 文件 并 无 区 别 ， 
所 以 本 程序 对 这 两 种 文件 都 有 效 。 

我 们 还 没有 回答 的 一 个 问题 是 如 何 选取 BUFFSIZE 值 。 在 回答 此 问 
题 之 前 ， 让 我 们 先 用 各 种 不 同 的 BUFFSIZE 值 来 运行 此 程序 。 图 3-6 显 示 
了 用 20 种 不 同 的 缓冲 区 长 度 ， 读 516 581 760 字 节 的 文件 所 得 到 的 结果 。 

用 图 3-5 的 程序 读 文 件 ， 其 标准 输出 被 重新 定 问 到 /dev/null 上 。 此 
测试 所 用 的 文件 系统 是 Linux ext4 文 件 系统 ， 其 磁盘 块 长 度 为 4 096 字 节 
(磁盘 块 长 度 由 st_blksize 表 示 ， 在 4.12 节 中 说 明 其 值 为 4 096) 。 这 也 
证 明了 图 3-6 中 系统 CPU 时 间 的 几 个 最 小 值 兰 不 多 出 现在 BUEFFSIZE 为 
4 096 及 以 后 的 位 置 ， 继 续 增 加 缓冲 区 长 度 对 此 时 间 几 乎 没有 影响 。 
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图 3-6 Linux 上 用 不 同 缓冲 长 度 进行 读 操作 的 时 间 结果 
大 多 数 文 件 系统 为 改善 性 能 都 采用 某 种 预 谈 〈read ahead) 技术 。 
当 检 测 到 正 进行 顺序 读 取 时 ， 系 统 束 试图 读 入 比 应 用 所 要 求 的 更 多 数 
据 ， 并 假想 应 用 很 快 就 会 读 这 些 数据 。 预 读 的 效果 可 以 从 图 3-6 中 看 
出 ， 绥 冲 区 长 度 小 至 32 字 节 时 的 时 钟 时 间 与 拥有 较 大 缓冲 区 长 度 时 的 时 
钟 时 间 几 乎 一 样 。 
我 们 以 后 还 将 回 到 这 一 实例 上 。3.14 节 将 用 此 说 明 同 步 写 的 效果 ， 
5.8 节 将 比较 不 带 缓 冲 的 MO 时 间 与 标准 IO 库 所 用 的 时 间 。 














应 当 了 解 ， 在 什么 时 间 对 实施 文件 读 、 写 操作 的 程序 进行 性 能 度 
量 。 操 作 系统 试图 用 高 速 缓存 技术 将 相关 文件 放置 在 主 存 中 ， 所 以 如 知 
重复 度量 程序 性 能 ， 那 么 后 续 运 行 该 程序 所 得 到 的 计时 很 可 能 好 于 第 一 
次 。 其 原因 是 ， 第 一 次 运行 使 得 文件 进入 系统 高 速 缓存 ， 后 续 各 次 运行 
一 般 从 系统 高 速 缓存 访问 文件 ， 无 需 谈 、 写 做 盘 。 (incore 这 个 词 的 意 
思 是 在 主 存 中 ， 早 期 计算 机 的 主 存 是 用 铁 氧 体 磁 心 〈ferrite core) 做 
的 ， 这 也 是 “core dump” 这 个 词 的 由 来 : 程序 的 主 存 镜像 存放 在 磁盘 的 一 
个 文件 中 以 便 测 试 诊 断 ) 。 

在 图 3-6 所 示 的 测试 数据 中 ， 不 同 缓冲 区 长 度 的 各 次 运行 使 用 不 同 
的 文件 副本 ， 所 以 后 一 次 运行 不 会 在 前 一 次 运行 的 高 速 缓存 中 找到 它 需 
要 的 数据 。 这 些 文件 都 足够 大 ， 不 可 能 全 部 保留 在 高 速 缓存 中 (测试 系 
统 配置 了 6 GB RAM) 。 




















3.10 VRE 


UNIX 系 统 支 持 在 不 同 进程 间 共 享 打 开 文 件 。 在 介绍 dup 函 数 之 前 ， 
先 要 说 明 这 种 共享 。 为 此 先 介 绍 内 核 用 于 所 有 IO 的 数据 结构 。 

下 面 的 说 明 是 概念 性 的 ， 与 特定 实现 可 能 匹配 ， 也 可 能 不 匹配 。 请 
参阅 Bach[1986] 对 System V 中 相关 数据 结构 的 讨论 。McKusick 等 [1996] 
说 明 4.4BSD 中 的 相关 数据 结构 。McKusick 和 Neville-Nell[2005] 对 
FreeBSD 5.2 进行 了 介绍 。 对 Solaris 的 类 似 讨 论 请 参见 McDougall 和 
Marno[2007]。Linux 2.6 内 核 体系 结构 介绍 请 参见 Bovet 和 Cesati[2006]。 

内 核 使 用 3 种 数据 结构 表示 打开 文件 ， 它 们 之 间 的 关系 决定 了 在 文 
件 共享 方面 一 个 进程 对 男 一 个 进程 可 能 产生 的 影响 。 

(1) 每 个 进程 在 进程 表 中 都 有 一 个 记录 项 ， 记 录 项 中 包含 一 张 打 
开 文 件 描述 符 表 ， 可 将 其 视 为 一 个 矢量 ， 每 个 摘 述 符 占 用 一 项 。 与 每 个 
文件 描述 符 相 关联 的 是 : 

a. 文件 描述 符 标 志 (close_on exec， 参 见 图 3-7 和 3.14 节 )，; 

b. 指 同 一 个 文件 表 项 的 指针 。 

(2) 内 核 为 所 有 打开 文件 维持 一 张 文 件 表 。 每 个 文件 表 项 包含 : 

a. 文件 状态 标志 ( 读 、 写 、 添 写 、 同 步 和 非 阻塞 等 ， 关 于 这 些 标 
志 的 更 多 信息 参见 3.14 节 ) ; 

b. 当前 文件 偏 移 量 ; 

c. 指向 该 文件 v 节 点 表 项 的 指针 。 

(3) 每 个 打开 文件 (或 设备 ) 都 有 一 个 v 节点 (v-node) 结构 。v 
节点 包含 了 文件 类 型 和 对 此 文件 进行 各 种 操作 函数 的 指针 。 对 于 大 多 数 
MIF, VA RIDA SIENA Ci-node, ZITA) 。 这 些 信 息 
是 在 打开 文件 时 从 磁盘 上 读 入 内 存 的 ， 所 以 ， 文 件 的 所 有 相关 信息 都 是 
随时 可 用 的 。 例 如 ，i 节点 包含 了 文件 的 所 有 者 、 文 件 长 度 、 指 癌 文件 
实际 数据 块 在 磁盘 上 所 在 位 置 的 指针 等 〈4.14 节 较 详 细 地 说 明了 典型 
UNIX 系 统 文件 系统 ， 并 将 更 多 地 介绍 i 节 点 ) 。 

Linux 没 有 使 用 v 节 点 ， 而 是 使 用 了 通用 十 点 结构 。 虽 然 两 种 实现 有 
所 不 同 ， 但 在 概念 上 ， v 节 点 与 i 节 点 是 一 样 的 。 两 者 都 指 癌 文件 系统 特 
有 的 i 节点 结构 。 

我 们 忽略 了 那些 不 影响 讨论 的 实现 细节 。 例 如 ， 打 开 文 件 描述 符 表 
可 存放 在 用 户 空间 (作为 一 个 独立 的 对 应 于 每 个 进程 的 结构 ， 可 以 换 
E) ， 而 非 进程 表 中 。 这 些 表 也 可 以 用 多 种 方式 实现 ， 不 必 一 定 是 数 
































组 ， 例 如 ， 可 将 它们 实现 为 结构 的 链表 。 如 采 不 考虑 实现 细节 的 话 ， 通 


用 概念 是 相同 的 。 





图 3-7 显 示 了 一 个 进程 对 应 的 3 张 表 之 间 的 关系 。 该 进程 有 两 个 不 同 
的 打开 文件 : 一 个 文件 从 标准 输入 打开 《文件 描述 符 0) ， 男 一 个 从 标 


准 输出 打开 《文件 描述 符 为 1) 。 
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图 3-7 打开 文件 的 内 核 数据 结构 
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从 UNIX 系 统 的 早期 版 本 [Thompson 1978] 以 来 ， 这 3 张 表 之 间 的 关系 
一 直 保 持 至 今 。 这 种 关系 对 于 在 不 同 进程 之 间 共 享 文件 的 方式 非常 重 
要 。 在 以 后 的 章节 中 涉及 其 他 文件 共享 方式 时 还 会 回 到 这 张 图 上 来 。 

创建 v 节点 结构 的 目的 是 对 在 一 个 计算 机 系统 上 的 多 文件 系统 类 型 
提供 支持 。 这 一 工作 是 Peter Weinberger (NIK XZ) 和 Bill Joy (Sun 
公司 ) 分 别 独立 完成 的 。Sun 把 这 种 文件 系统 称 为 虚拟 文件 系统 


(Virtual File 





System) ， 把 与 文件 系统 无 关 的 i 闻 扣 部 分 称 为 Vv 节 所 


[Kleiman 1986]. 

当 各 个 制造 商 的 实现 增加 了 对 Sun 的 网 络 文件 系统 (NFS) 的 支持 
时 ， 它 们 都 广泛 采用 了 v 节 点 结构 。 在 BSD 系 列 中 首先 提供 v 节 点 的 是 增 
加 了 NFS 的 4.3BSD Reno. 

在 SVR4 中 ，v 节 点 蔡 代 了 SVR3 中 与 文件 系统 无 关 的 i 节点 结构 。 
Solaris 是 从 SVR4 发 展 而 来 的 ， 因 此 它 也 使 用 v 节 点 。 

Linux 没 有 将 相关 数据 结构 分 为 i 节 点 和 v 节 点 ， 而 是 采用 了 一 个 与 文 
件 系统 相关 的 i 节 点 和 一 个 与 文件 系统 无 关 的 i 节 点 。 
要 如 果 两 个 独立 进程 各 自打 开 了 同一 文件 ， 则 有 图 3-8 中 所 示 的 关 











fd 0): 
fd 1: 
fd 2: 
fd 3; 
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图 3-8 两 个 独立 进程 各 自打 开 同 一 个 文件 

我 们 假定 第 一 个 进程 在 文件 描述 符 3 上 打开 该 文件 ， 而 另 一 个 进程 
在 文件 描述 符 4 上 打开 该 文件 。 打 开 该 文件 的 每 个 进程 都 获得 各 目的 一 
个 文件 表 项 ， 但 对 一 个 给 定 的 文件 只 有 一 个 v 市 扩 表 项 。 之 所 以 每 个 进 
程 都 获得 目 己 的 文件 表 项 ， 是 因为 这 可 以 使 每 个 进程 都 有 它 上 自己 的 对 该 
文件 的 当前 偏 移 量 。 

给 出 了 这 些 数据 结构 后 ， 现 在 对 前 面 所 述 的 操作 进一步 说 明 。 

“在 完成 每 个 write 后 ， 在 文件 表 项 中 的 当前 文件 偏 移 量 即 增加 所 写 
入 的 字 节 数 。 如 宁 这 导致 当前 文件 侦 移 量 超出 了 当前 文件 长 度 ， 则 将 i 














节点 表 项 中 的 当前 文件 长 度 设 置 为 当前 文件 仿 移 量 〈 也 就 是 该 文件 加 长 
F 


如 果 用 O_APPEND 标 志 打 开 一 个 文件 ， 则 相应 标志 也 被 设置 到 文 
件 表 项 的 文件 状态 标志 中 。 每 次 对 这 种 具有 追加 写 标志 的 文件 执行 写 操 
作 时 ， 文 件 表 项 中 的 当前 文件 偏 移 量 首先 会 被 设置 为 i 节 点 表 项 中 的 文 
件 长 度 。 这 就 使 得 每 次 写 入 的 数据 都 追加 到 文件 的 当前 尾 端 处 。 

。 若 一 个 文件 用 lseek 定 位 到 文件 当前 的 尾 端 ， 则 文件 表 项 中 的 当前 
文件 偏 移 量 被 设置 为 节点 表 项 中 的 当前 文件 长 度 GER, SA 
O_APPEND 标 志 打 开 文 件 是 不 同 的 ， 详 见 3.11 节 ) 。 

*lseek 函 数 只 修改 文件 表 项 中 的 当前 文件 偏 移 量 ， 不 进行 任何 1/O 操 


E. 

可 能 有 多 个 文件 描述 符 项 指 癌 同一 文件 表 项 。 在 3.12 ” 节 中 讨论 dup 
函数 时 ， 我 们 就 能 看 到 这 一 点 。 在 fork 后 也 发 生 同 样 的 情况 ， 此 时 父 进 
程 、 子 进程 各 自 的 每 一 个 打开 文件 插 述 符 共 至 同一 个 文件 表 项 ( 见 8.3 
<6 


注意 ， 文 件 描述 符 标 志和 文件 状态 标志 在 作用 范围 方面 的 区 别 ， 前 
者 只 用 于 一 个 进程 的 一 个 描述 符 ， 而 后 者 则 应 用 于 指 癌 该 给 定 文 件 表 项 
的 任何 进程 中 的 所 有 描述 符 。 在 3.14 节 说 明 fcntl 函 数 时 ， 我 们 将 会 了 解 
如 何 获取 和 修改 文件 描述 符 标 志和 文件 状态 标志 。 

本 市 前 面 所 述 的 一 切 对 于 多 个 进程 读 取 同一 文件 都 能 正确 工作 。 每 
个 进程 都 有 它 自 己 的 文件 表 项 ， 其 中 也 有 它 自 己 的 当前 文件 偏 移 量 。 但 
是 ， 妆 多 个 进程 写 同一 文件 时 ， 则 可 能 产生 预想 不 到 的 结果 。 为 了 说 明 
如 何 避 免 这 种 情况 ， 需 要 理解 原子 操作 的 概念 。 






































3.11 原子 操作 


1. 下 如 到 二 个 又 作 

考虑 一 个 进程 ， 它 要 将 数据 奶 加 到 一 个 文件 尾 端 。 早 期 的 UNIX 系 
统 版 本 并 不 支持 open 的 O _APPEND 选 项 ， 所 以 程序 被 编写 成 下 列 形式 : 

让 (lseek(fd,OL, 2) < 0) /*position to EOF*/ 

if (write(fd, buf, 100) != 100) /*and write*/ 

err_sys("Iseek error"); 
err_sys("write error"); 

对 单个 进程 而 言 ， 这 上 段 程序 能 正常 工作 ， 但 寿 有 多 个 进程 同时 使 用 
这 种 方法 将 数据 退 加 写 到 同一 文件 ， 则 会 产生 问题 (例如 ， 寿 此 程序 由 
a 各 上 自 将 消息 退 加 到 一 个 日 志文 件 中 ， 融 会 产生 这 种 
情况 ) 。 

假定 有 两 个 独立 的 进程 A 和 B 都 对 同一 文件 进行 退 加 写 操 作 。 每 个 
进程 都 已 打开 了 该 文件 ， 但 未 使 用 O_APPEND 标 志 。 此 时 ， 各 数据 结构 
之 间 的 关系 如 图 3-8 中 所 示 。 每 个 进程 都 有 它 上 自己 的 文件 表 项 ， 但 是 共 
享 一 个 v 节 点 表 项 。 假 定 进程 A 调 用 了 lseek， 它 将 进程 A 的 该 文件 当前 偏 
移 量 设置 为 1 500 字 市 (当前 文件 尾 并 处 ) 。 然 后 内 核 切换 进程 ， 进 程 B 
运行 。 进 程 B 执 行 lseek， 也 将 其 对 该 文件 的 当前 偏 移 量 设置 为 1 500 字 他 
(当前 文件 尾 端 处 )。 然 后 B 调 用 write， 它 将 B 的 该 文件 当前 文件 偏 移 
量 增加 至 1 600。 因 为 该 文件 的 长 度 已 经 增加 了 ， 所 以 内 核 将 v 节 点 中 的 
当前 文件 长 度 更 新 为 1 600。 然 后 ， 内 核 义 进行 进程 切换 ， 使 进程 A 恢复 
运行 。 当 A 调用 write 时 ， 束 从 其 当前 文件 偏 移 量 (1 500) 处 开始 将 数据 
写 入 到 文件 。 这 样 也 就 履 盖 了 进程 B 刚 才 写 入 到 该 文件 中 的 数据 。 

问题 出 在 逻辑 操作 “ 先 定位 到 文件 尾 端 ， 然 后 写 ”"， 它 使 用 了 两 个 分 
开 的 函数 调用 。 解 决 问题 的 方法 是 使 这 两 个 操作 对 于 其 他 进程 而 言 成 为 
一 个 原子 操作 。 任 何 要 求 多 于 一 个 函数 调用 的 操作 都 不 是 原子 操作 ， 
oe ， 内 核 有 可 能 会 临时 挂 起 进程 (正如 我 们 前 面 所 
WERI) o 

UNIX 系 统 为 这 样 的 操作 提供 了 一 种 原子 操作 方法 ， 即 在 打开 文件 
时 设置 O_APPEND 标 志 。 正 如 前 一 市 中 所 述 ， 这 样 做 使 得 内 核 在 每 次 写 
操作 之 前 ， 都 将 进程 的 当前 偏 移 量 设置 到 该 文件 的 尾 端 处 ， 于 是 在 每 次 
写 之 前 就 不 再 需要 调用 lseek。 

2. pki pread fill pwrite 























Single UNIX Specification 包 括 了 XSI 扩 展 ， 该 扩展 允许 原子 性 地 定 
位 并 执行 WJO。pread 和 pwrite 就 是 这 种 扩展 。 
#include <unistd.h> 
ssize_t pread(int fd, void *buf, size_t nbytes, off_t offset); 
返回 值 : 读 到 的 字 节 数 ， 大 已 到 文件 尾 ， 返 回 0; Arie, e- 
ssize_t pwrite(int fd, const void *buf, size_t nbytes, off t offset); 
返回 值 : 知 成 功 ， 返 回 已 写 的 字 节 数 ; 各 出 错 ， 返 回 -1 
调用 pread 相 当 于 调用 lseek 后 调用 read， 但 是 pread 又 与 这 种 顺序 调 
用 有 下 列 重要 区 别 。 
“调用 pread 时 ， 无 法 中 断 其 定位 和 读 操作 。 
"不 更 新 当前 文件 偏 移 量 。 
调用 pwrite 相 当 于 调用 lseek 后 调用 write， 但 也 与 它们 有 类 似 的 区 
All o 


3u 创 建 一 个 文件 
对 open 函 数 的 O CREAT 和 O_EXCL 选 项 进行 说 明 时 ， 我 们 已 见 到 
另 一 个 有 关 原 子 操作 的 例子 。 当 同时 指定 这 两 个 选项 ， 而 该 文件 又 已 经 
存在 时 ，open 将 失败 。 我 们 曾 提 及 检查 文件 是 否 存 在 和 创建 文件 这 两 个 
操作 是 作为 一 个 原子 操作 执行 的 。 如 果 没 有 这 样 一 个 原子 操作 ， 那 么 可 
能 会 编写 下 列 程序 段 : 
if ((fd = open(pathname, O_WRONLY)) <0){ 
if (errno == ENOENT) { 
if ((fd = creat(path, mode)) < 0) 
err_sys("creat error"); 
} else{ 
err_sys("open error"); 








} 

如 果 在 open 和 creat 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 就 会 出 现 问 
题 。 知 在 这 两 个 函数 调用 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 并 且 写 入 了 
一 些 数据 ， 然 后 ， 原 先进 程 执 行 这 段 程序 中 的 creat， 这 时 ， 刚 由 另 一 进 
程 写 入 的 数据 就 会 被 擦 去 。 如 车 将 这 两 者 合并 在 一 个 原子 操作 中 ， 这 种 
问题 也 就 不 会 出 现 。 

一 般 而 言 ， 原 子 操作 (atomic operation) 指 的 是 由 多 步 组 成 的 一 个 
操作 。 如 果 访 操作 原子 地 执行 ， 则 要 么 执行 完 所 有 步骤 ， 要 么 一 步 也 不 
执行 ， 不 可 能 只 执行 所 有 步骤 的 一 个 子 集 。 在 4.15 节 摘 述 link 函 数 以 及 
在 14.3 节 中 说 明 记 录 锁 时 ， 还 将 讨论 原子 操作 。 





3.12 负数 dup 和 dup2 


下 面 两 个 函数 都 可 用 来 复制 一 个 现 有 的 文件 描述 符 。 
#include <unistd.h> 
int dup(int fd); 
int dup2(int fd, int fd2); 
PARRA IEE: 知 成 功 ， 返 回 新 的 文件 描述 符 ; At, e- 
由 dup 返 回 的 新 文件 描述 符 一 定 是 当前 可 用 文件 描述 符 中 的 最 小 数 
{Bo XF dup2， 可 以 用 fd2 参 数 指定 新 描述 符 的 值 。 如 果 fd2 已 经 打开 ， 
则 先 将 其 关闭 。 如 知 fd 等 于 fd2， 则 dup2 返 回 fd2， 而 不 关闭 它 。 人 否则 ， 
fd2 的 FD_CLOEXEC 文 件 描述 符 标志 就 被 清除 ， 这 样 fd2 在 进程 调用 exec 
时 是 打开 状态 。 
T ER 
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图 3-9 dup(1) 后 的 内 核 数 据 结构 
在 此 图 中 ， 我 们 假定 进程 局 动 时 执行 了 : 
newfd = dup(1); 





当 此 函数 开始 执行 时 ， 假 定 下 一 个 可 用 的 描述 符 是 3《〈 这 是 非常 可 
能 的 ， 因 为 0，1 和 2 都 由 shell 打 开 〉，。 因 为 两 个 描述 符 指 癌 同一 文件 表 
项 ， 所 以 它们 共享 同一 文件 状态 标志 ( 读 、 写 、 追 加 等 ) 以 及 同一 当前 
文件 偏 移 量 。 

每 个 文件 描述 符 都 有 它 自 己 的 一 套 文件 描述 符 标 志 。 正 如 我 们 将 在 
下 一 节 中 说 明 的 那样 ， 新 摘 述 符 的 执行 时 关闭 (close-on-exec) 标志 总 
JE H dup A ŠOA BR o 

复制 一 个 描述 符 的 另 一 种 方法 是 使 用 fcntl pKa, 3.14 市 将 对 该 函 
数 进 行 说 明 。 实 际 上 ， 调 用 

dup(fd); 

等 效 于 

fcntl (fd, F_DUPFD, 0); 

而 调用 

dup2(fd, fd2); 

等 效 于 

close(fd2); 

fentl(fd, F_DUPFD, fd2); 

在 后 一 种 情况 下 ，dup2 并 不 完全 等 同 于 close 加 上 fcntl。 它 们 之 间 的 
区 别 具 体 如 下 。 

(1) dup2 是 一 个 原子 操作 ， 而 close 和 fcnt 包括 两 个 函数 调用 。 
有 可 能 在 close 和 fcntl 之 间 调 用 了 信号 捕获 函数 ， 它 可 能 修改 文件 摘 述 
符 〈 第 10 章 将 说 明 信 号 ) 。 如 果 不 同 的 线程 改变 了 文件 描述 符 的 话 也 会 
出 现 相 同 的 问题 〈 第 11 章 将 说 明 线 程 ) 。 

(2) dup2 和 fcntl 有 一 些 不 同 的 errno。 

dup2 系 统 调用 起 源 于 V7， 然 后 传播 至 所 有 BSD 版 本 。 而 复制 文件 擂 
述 符 的 fcnt 方 法 则 首先 由 系统 II 使 用 ， 然 后 由 System V 继 续 采 用 。 
SVR3.2 选 用 了 dup2 函 数 ，4.2BSD 则 选用 了 fcntl 函 数 及 F_DUPFD 功 能 。 
POSIX.1 要 求 兼 有 dup2 及 fcntl 的 F_DUPFD 两 种 功能 。 








3.13 打数 sync、fsync 和 fdatasync 


传统 的 UNIX 系 统 实现 在 内 核 中 设 有 绥 冲 区 高 速 绥 存 或 页 高 速 绥 
存 ， 大 多 数 磁盘 WO 都 通过 绥 冲 区 进行 。 当 我 们 向 文件 写 入 数据 时 ， 内 
核 通常 先 将 数据 复制 到 缓冲 区 中 ， 然 后 排 入 队列 ， 晚 些 时 候 再 写 入 磁 
盘 。 这 种 方式 被 称 为 延迟 写 (delayed write) (Bach[1986] 的 第 3 章 详 细 
讨论 了 缓冲 区 高 速 缓存 ) 。 

通常 ， 当 内 核 需 要 重用 绥 冲 区 来 存放 其 他 磁盘 块 数 据 时 ， 它 会 把 所 
有 延 人 运 写 数据 块 写 入 人 磁盘。 为 了 保证 磁盘 上 实际 文件 系统 与 缓冲 区 中 内 
容 的 一 致 性 ，UNIX 系统 提供 了 sync、fsync 和 fdqatasync 三 个 函数 。 

#include<unistd.h> 

int fsync(int fd); 

int fdatasync(int fd); 














返回 值 : ARD, IO; 辱 出 错 ， 返 回 -1 
void sync(void); 
sync 只 是 将 所 有 修改 过 的 块 缓冲 区 排 入 写 队 列 ， 然 后 就 返回 ， 它 并 
不 等 竺 实际 写 磁 盘 操作 结束 。 
通常 ， 称 为 update 的 系统 守护 进程 周期 性 地 调用 一般 每 隔 30 秒 ) 
sync 消 数 。 这 就 保证 了 定期 冲洗 Cush) 内核 的 块 缓冲 区 。 命 令 sync(1) 
也 调用 sync 函 数 。 
fsync 水 数 只 对 由 文件 描述 符 fd 指定 的 一 个 文件 起 作用 ， 并 且 等 待 写 
磁盘 操作 结束 才 返 回 。fsync 可 用 于 数据 库 这 样 的 应 用 程序 ， 这 种 应 用 程 
序 需 要 确保 修改 过 的 块 立 即 写 到 磁盘 上 。 
fdatasync 函 数 类 似 于 fsync， 但 它 只 影响 文件 的 数据 部 分 。 而 除数 气 
外 ，fsync 还 会 同步 更 新 文件 的 属性 。 
本 书 说 明 的 所 有 4 种 平台 都 支持 sync 和 fsync 函 数 。 但 是 ，FreeBSD 8.0 不 
支持 fdatasync。 


3.14 KA fcntl 
fcnt 函 数 可 以 改变 已 经 打开 文件 的 属性 。 


#include<fcntl.h> 
int fcntl(int fd, int cmd, ... /* int arg */); 
返回 值 : 若 成 功 ， 则 依赖 于 cmd CLE) ; 车 出 错 ， 返 回 -1 

在 本 节 的 各 实例 中 ， 第 3 个 参数 总 是 一 个 整数 ， 与 上 面 所 示 函 数 原 
型 中 的 注释 部 分 对 应 。 但 是 在 14.3 节 说 明 记 录 锁 时 ， 第 3 个 参数 则 是 指 
问 一 个 结构 的 指针 。 

fcntl 函 数 有 以 下 5 种 功能 。 

(1) 复制 一 个 已 有 的 摘 述 符 〈cmd=F_DUPFD 或 
F_DUPFD_CLOEXEC) 。 

(2) 获取 /设置 文件 描述 符 标 志 (cmd=F_GETFD 或 F_SETFD) 。 

(3) 获取 /设置 文件 状态 标志 (cmd=F_GETFL 或 F_SETFL) 。 

(4) 获取 /设置 异步 JO 所 有 权 (cmd=F_GETOWN 或 
F SETOWN) 。 

(5) 获取 /设置 记录 锁 (cmd=F_GETLK、F_SETLK 或 
F_SETLKW) 。 

我 们 先 说 明 这 11 种 cmd 中 的 前 8 种 (14.3 节 说 明 后 3 种 ， 它 们 都 与 记 
MAK) 。 参 照 图 3-7， 我 们 将 讨论 与 进程 表 项 中 各 文件 描述 符 相 关 
联 的 文件 摘 述 符 标 志 以 及 每 个 文件 表 项 中 的 文件 状态 标志 。 

F_DUPFD 复制 文件 描述 符 fd。 新 文件 描述 符 作为 函数 值 
返回 。 它 是 尚未 打开 的 各 描述 符 中 大 于 或 等 于 第 3 个 参数 值 〈 取 为 整 型 
值 ) 中 各 值 的 最 小 值 。 新 描述 符 与 fd 共享 同一 文件 表 项 〈 见 图 3-9) 。 
但 是 ， 新 描述 符 有 它 目 己 的 一 套 文件 描述 符 标 志 ， 其 FD_CLOEXEC X 
件 描述 符 标志 被 清除 〈 这 表示 该 描述 符 在 exec 时 仍 保持 有 效 ， 我 们 将 在 
第 8 章 对 此 进行 讨论 ) 。 

F_DUPFD_CLOEXEC ”复制 文件 描述 符 ， 设 置 与 新 描述 符 关 联 的 
FD_CLOEXEC 文 件 描 述 符 标 志 的 值 ， 返 回 新 文件 描述 符 。 

F_GETFD 对 应 于 fd 的 文件 摘 述 符 标 志 作 为 函数 值 返 回 。 当 前 只 定 
义 了 一 个 文件 摘 述 符 标 志 FD_CLOEXEC 。 

F_SETFD 对 于 fd 设置 文件 描述 符 标 志 。 新 标志 值 按 第 3 个 参数 〈 取 
为 整 型 值 ) 设置 。 

要 知道 ， 很 多 现 有 的 与 文件 描述 符 标 志 有 关 的 程序 并 不 使 用 稼 量 











FD_CLOEXEC， 而 是 将 此 标志 设置 为 0〈 系 统 默认 ， 在 exec 时 不 关闭 ) 
或 1 (在 exec 时 关闭 ) 。 

F_ GETFL 对 应 于 fd 的 文件 状态 标志 作为 函数 值 返回 。 我 们 在 说 明 
open 函 数 时 ， 己 描述 了 文件 状态 标志 。 它 们 列 在 图 3-10 中 。 


O_RDONLY 
O_WRONLY 
O_RDWR 
O_EXEC 
O_SEARCH 
O_APPEND 
O_NONBLOCK 
O_SYNC 
O_DSYNC 
O_RSYNC 
C 
C 


等 待 写 完成 ( 仅 FreeBSD 和 Mac OS X) 
56 VO ( 仅 FreeBSD 和 Mac OS X) 


O_FSYN 
O_ASYN 











图 3-10 对 于 fcnt 的 文件 状态 标志 

遗憾 的 是 ，5 个 访问 方式 标志 (O_RDONLY、O_WRONLY、 
O_RDWR, O EXECLV/R 有 O SEARCH) 并 不 备 占 1 位 (如 前 所 述 ， 由 于 
历史 原因 ， 前 3 个 标志 的 值 分 别 是 0、1 和 2。 这 5 个 值 互 斥 ， 一 个 文件 的 
访问 方式 只 能 取 这 5 个 值 之 一 ) 。 因 此 首先 必须 用 屏蔽 字 O_ACCMODE 
取得 访问 方式 位 ， 然后 将 结果 与 这 5 个 值 中 的 每 一 个 相 比较 。 

F_SETFL 将 文件 状态 标志 设置 为 第 3 个 参数 的 值 〈 取 为 整 型 值 ) 。 
可 以 更 改 的 几 个 标志 是 : O_APPEND、O_NONBLOCK、O_SYNC、 
O_DSYNC、O_RSYNC、O_FSYNC 和 O_ASYNC。 

F_GETOWN 获取 当前 接收 SIGIO 和 SIGURG 信 和 号 的 进程 ID 或 进程 组 
ID。14.5.2 节 将 论述 这 两 种 异步 O 信 和 号 。 

F SETOWN 设置 接收 SIGIO 和 SIGURG 信 号 的 进程 ID 或 进程 组 ID。 








正 的 arg 指 定 一 个 进程 ID， 负 的 arg 表 示 等 于 arg 绝 对 值 的 一 个 进程 组 ID。 

fcntl 的 返回 值 与 命令 有 关 。 如 果 出 错 ， 所 有 命令 都 返回 一 1， 如 果 
成 功 则 返回 某 个 其 他 值 。 下 列 4 个 命令 有 特定 返回 值 : F_DUPFD、 
F_ GETFD、F_GETFL 以 及 F_GETOWN。 第 1 个 命令 返回 新 的 文件 描述 
符 ， 第 2 个 和 第 3 个 命令 返回 相应 的 标志 ， 最 后 一 个 命令 返回 一 个 正 的 进 
程 ID 或 负 的 进程 组 ID。 

实例 

图 3-11 中 所 示 程 序 的 第 1 个 参数 指定 文件 描述 符 ， 并 对 于 该 描述 符 
打印 其 所 选择 的 文件 标志 说 明 。 


#include "apue.h" 


#include <fcntl.h> 


int 
Main(int argc, char *argv[]) 
{ 


int val; 


if (argc != 2) 
err quit("usage: a.out <descriptor#>") ; 


if ((val = fcntl (atoi (argv[1]), F GETFL, 0)) < 0) 
err sys("fcntl error for fd sd", atoi(argv[1])); 


switch (val & © ACCMODE) { 
case O_RDONLY: 
printf ("read only"); 
break; 


case O _WRONLY: 
printf ("write only"); 
break; 


case O_RDWR: 
printf ("read write"); 
break; 


default: 
err dump ("unknown access mode"); 


if (val & O APPEND) 
printf (", append"); 
if (val & O NONBLOCK) 
printf (", nonblocking"); 
if (val & 0 SYNC) 
printf (", synchronous writes"); 


#if !defined(_POSIX_C_SOURCE) && defined(O_FSYNC) && (O_FSYNC != 0 SYNC) 
if (val & O FSYNC) 
printf(", synchronous writes") ; 


tendif 


putchar('\n'); 
exit (0); 





图 3-11 对 于 指定 的 描述 符 打印 文件 标志 

注意 ， 我 们 使 用 了 功能 测试 宏 _POSIX_C_SOURCE， 并 且 条 件 编译 
了 POSIX.1 中 没有 定义 的 文件 访问 标志 。 下 面 显示 了 从 bash (Bourne- 
again shell) 调用 该 程序 时 的 几 种 情况 。 当 使 用 不 同 shell 时 ， 结 果 会 有 些 
不 同 。 

$./a.out 0 < /dev/tty 

read only 

$./a.out 1 > temp.foo 

$ cat temp.foo 

write only 

$./a.out 2 2>>temp.foo 

write only, append 

$./a.out 5 5<>temp.foo 

read write 

子 句 5<>temp.foo 表 示 在 文件 描述 符 5 上 打开 文件 temp.foo 以 供 读 、 
=e 

实例 

fE ICRC TT RENT Pn a 或 文件 状态 标志 时 必须 谨慎 ， 先 要 获得 现 
的 标志 值 ， 然 后 按照 期 里 修改 已 已 ， 最 后 设置 新 标志 值 。 不 能 只 是 执行 
F_SETFD 或 F_SETFL 命 仿 ， 这 样 会 关闭 以 前 设置 的 标志 位 。 
和 图 3-12 是 对 于 一 个 文件 描述 符 设 置 一 个 或 多 个 文件 状态 标志 的 函 
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finclude "apue 
finclude <fcntl.h> 


void 
set fl(int fd, int flags) /* flags are file status flags to turn on */ 
| 


int val; 


if ((val = fontl(fd, F GETFL, 0)) < 0) 
err sys("fontl F GETFL error"); 


val |= flags; /* turn on flags */ 


if (fentl (fd, F SETFL, val) < 0) 
err sys("fcntl F SETFL error"); 


图 3-12 对 一 个 文件 描述 符 开 局 一 个 或 多 个 文件 状态 标志 

如 果 将 中 间 的 一 条 语句 改 为 : 

val &= ~flags; /* turn flags off */ 

束 构 成 男 一 个 函数 ， 我 们 称 为 ”dlr_ fl， 并 将 在 后 面 某 些 例 子 中 用 到 
。 此 语句 使 当前 文件 状态 标志 值 vaj 与 fags 的 反 码 进行 逻辑 “与 ?运算 。 
ee P EEE A E 
步 与 未 起 o 

set_fl(STDOUT_FILENO, O_SYNC); 

这 束 使 每 次 write 都 要 等 待 ， 直 至 数据 已 写 到 磁盘 上 再 返回 。 在 
UNIX 系 统 中 ， 通 常 write 只 是 将 数据 排 入 队列 ， 而 实际 的 写 磁 盘 操 作 则 
可 能 在 以 后 的 某 个 时 刻 进 行 。 而 数据 库 系 统 则 需要 使 用 O_SYNC， 这 样 
一 来 ， 当 它 从 write 返回 时 就 知道 数据 已 确实 写 到 了 磁盘 上 ， 以 免 在 系 
统 异 稼 时 产生 数据 丢失 。 

程序 运行 时 ， 设 置 O_SYNC 标 志 会 增加 系统 时 间 和 时 钟 时 间 。 为 了 
测试 这 一 点 ， 先 运行 图 3-5 程 序 ， 它 从 一 个 磁盘 文件 中 将 492.6 ”MB 的 数 





D} 








据 复制 到 另 一 个 文件 。 然 后 ， 对 比 设 置 了 O_SYNC 标 志 的 程序 ， 使 其 完 
成 同样 的 工作 。 在 使 用 ext4 文 件 系统 的 Linux 上 执行 上 述 操作 ， 得 到 的 结 
果 如 图 3-13 所 示 。 


O e p p a 


取 自 图 36 中 BUFFSI2E=4 096 的 读 时 间 
上 上 常 写 到 磁盘 文件 


设置 0SYNC 后 写 到 磁盘 文件 

SPI oe WY fdatasync 

写 到 磁盘 后 接着 调用 Esync 

设置 0_SYNC HAINE, RAWH fsync 








图 3-13 在 Linux ext4 中 采用 各 种 同步 机 制 后 的 计时 结果 

图 3-13 中 的 6 行 都 是 在 BUFFSIZE 为 4 096 字 节 时 测量 的 。 图 3-6 中 的 
结果 所 测量 的 情况 是 读 一 个 磁盘 文件 ， 然 后 写 到 /dev/null， 所 以 没有 磁 
盘 输 出 。 图 3-13 中 的 第 2 行 对 应 于 读 一 个 磁盘 文件 ， 然 后 写 到 另 一 个 磁 
盘 文件 中 。 这 就 是 为 什么 图 3-13 中 第 1 行 与 第 2 行 有 差别 的 原因 。 在 写 磁 
盘 文 件 时 ， 系 统 时 间 增 加 了 ， 其 原因 是 内 核 需要 从 进程 中 复制 数据 ， 并 
将 数据 排 入 队列 以 便 由 磁盘 驱动 器 将 其 写 到 磁 竹 上 。 当 写 至 磁盘 文件 
时 ， 我 们 期 望 时 钟 时 间 也 会 增加 。 

当 支 持 同 步 写 时 ， 系 统 时 间 和 时 钟 时 间 应 当 会 显著 增加 。 但 从 第 3 
行 可 见 ， 同 步 写 所 用 的 系统 时 间 并 不 比 延 迟 写 所 用 的 时 间 增 加 很 多 。 这 
意味 着 要 么 Linux 操 作 系 统 对 延迟 写 和 同步 写 操 作 的 工作 量 相 同 〈 这 其 
实 是 不 太 可 能 的 ) ， 要 么 O SYNC 标志 并 没有 起 到 期 望 的 作用 。 在 这 
种 情况 下 ，Linux 操 作 系统 并 不 允许 我 们 用 fcntl 设 置 O0_SYNC 标 志 ， 而 是 
显示 失败 但 没有 返回 出 错 ( 但 如 果 在 文件 打开 时 能 指定 该 标志 ， 我 们 还 
是 应 该 遵 重 这 个 标志 的 ) 。 

最 后 3 行 中 的 时 钟 时 间 反 映 了 所 有 写 操作 写 入 磁盘 时 需要 的 附加 等 
竺 时 间 。 同 步 写 入 文件 之 后 ， 我 们 希望 对 fsync 的 调用 并 不 会 产生 效 
果 。 这 种 情况 理应 在 图 3-13 中 的 最 后 一 行 中 呈现 ， 但 既然 O_SYNC 标 
志 并 没有 起 到 预期 的 作用 ， 所 以 最 后 一 行 和 第 5 行 的 表现 几乎 相同 。 

图 3-14 显 示 了 在 采用 HFS 文 件 系统 的 Mac OS X 10.6.8 上 运行 同样 的 
测试 得 到 的 计时 结果 。 该 计时 结果 与 我 们 的 期 望 相符 : 同步 写 比 延迟 写 
所 消耗 的 时 间 增 加 了 很 多 ， 而 且 在 同步 写 后 再 调用 函数 fsync 并 不 产生 测 



































量 结 果 上 的 显著 差别 。 还 要 注意 的 是 ， 在 延迟 写 后 增加 一 个 fsync 函 数 调 
用 ， 测 量 结 果 的 差别 也 不 大 。 其 可 能 原因 是 ， 在 向 茶 个 文件 写 入 新 数据 
时 ， 操 作 系 统 已 经 将 以 前 写 入 的 数据 部 冲洗 到 了 磁盘 上 ， 所 以 在 调用 函 
数 fsync 时 只 需要 做 很 少 的 工作 。 





时 钟 时 间 (s) 


5 到 /dev/null 
正常 写 到 磁盘 文件 


RE O SYNC 后 写 到 磁盘 文件 
写 到 磁盘 后 接着 调用 fsync 
设置 0 SYNC 后 写 到 磁盘 ， 接 着 调用 fsync 


图 3-14 在 Mac OS X HFS 中 采用 各 种 同步 机 制 后 的 计时 结果 

比较 fsync 和 fdatasync， 两 者 都 更 新 文件 内 容 ， 用 了 O_SYNC 标 志 ， 
每 次 写 入 文件 时 都 更 新 文件 内 容 。 每 一 种 调用 的 性 能 依赖 很 多 因素 ， 包 
括 底层 的 操作 系统 实现 、 人 磁盘 驱动 器 的 速度 以 及 文件 系统 的 类 型 。 

在 本 例 中 ， 我 们 看 到 了 fcntl 的 必要 性 。 我 们 的 程序 在 一 个 描述 符 
《标准 输出 ) 上 进行 操作 ， 但 是 根本 不 知道 由 shell 打 开 的 相应 文件 的 文 
件 名 。 因 为 这 是 shell 打 开 的 ， 因 此 不 能 在 打开 时 按 我 们 的 要 求 设置 
O_SYNC 标 志 。 使 用 fcnt， 我 们 只 需要 知道 打开 文件 的 描述 符 ， 就 可 以 
修改 描述 符 的 属性 。 在 讲解 非 阻 罕 管 道 时 (15.2 节 〉 还 会 用 到 fcntl， 因 
为 对 于 管道 ， 我 们 所 知 的 只 有 其 摘 述 符 。 

















3.15 Ph žtioctl 


ioctl 函 数 一 直 是 IO 操作 的 杂 物 箱 。 不 能 用 本 章 中 其 他 函数 表示 的 
IO 操作 通常 都 能 用 ioctl 表 示 。 终 端 JO 是 使 用 ioctl 最 多 的 地 方 〈 在 第 18 
章 中 将 看 到 ，POSIX.1 已 经 用 一 些 单 独 的 函数 代 奉 了 终端 IO 操作 ) 。 

#include <unistd.h> /* System V */ 

#include <sys/ioctl.h> /* BSD and Linux */ 

int ioctl(int fd, int request, ...); 

返回 值 : 和 若 出 错 ， 返 回 -1; 若 成 功 ， 返 回 其 他 值 

ioctl 函 数 是 Single UNIX Specification 标 准 的 一 个 扩展 部 分 ， 以 便 处 
理 STREAMS 设 备 [Rago 1993]， 但 是 ， 在 SUSv4 中 已 被 移 至 弃 用 状态 。 
UNIX 系 统 实现 用 它 进 行 很 多 杂项 设备 操作 。 有 些 实现 甚至 将 它 扩展 到 
用 于 普通 文件 。 

我 们 所 示 的 函数 原型 对 应 于 POSIX.1，FreeBSD 8.0 和 Mac OS X 
10.6.8 将 第 2 个 参数 声明 为 unsigned long。 因 为 第 2 个 参数 总 是 头 文件 中 一 
个 #defined 的 名 字 ， 所 以 这 种 细节 并 没有 什么 影响 。 

对 于 ISO ”C 原 型 ， 它 用 省 略 号 表示 其 余 参 数 。 但 是 ， 通 常 只 有 男 外 
一 个 参数 ， 它 常常 是 指 问 一 个 变量 或 结构 的 指针 。 

在 此 原型 中 ， 我 们 表示 的 只 是 ioctl 函 数 本 身 所 要 求 的 头 文件 。 

和 常 ， 还 要 求 男 外 的 设备 专用 头 文件 。 例 如 ， Do 
作 之 外 ， 终 端 WVO 的 ioctl 命 令 都 需要 头 文件 <termios.h>。 

每 个 设备 驱动 程序 可 以 定义 它 自己 专用 的 一 组 ioctl 命令 ， 系 统 则 
为 不 a 的 ioctl 命 令 。 图 3-15 中 总 结 T FreeBSD i$ 
的 通用 ioctl 命 令 的 一 些 类 别 。 




















| ee eile | h> 
文件 IO FIOxxx <sys/filio.h> 


磁带 VO MTIOxxx <sys/mtio.h> 
EEF IO | SIOxxx <sys/sockio.h> 
终端 IO TIOxxx <sys/ttycom.h> 





图 3-15 FreeBSD 中 通用 的 ioct 操 作 
磁带 操作 使 我 们 可 以 在 磁带 上 写 一 个 文件 结束 标志 、 倒 带 、 越 过 指 
定 个 数 的 文件 或 记录 等 ， 用 本 章 中 的 其 他 函数 〈read、write、lseek 等 ) 
所 以 ， 对 这 些 设 备 进 行 操作 最 容易 的 方法 就 是 使 
ioctl 
在 18.12 节 中 将 说 明 便 用 ioct 函 数 获取 和 设置 终 剖 前 窗口 大 小 ，19.7 节 
中 使 用 ioctl 函 数 访问 伪 终 端的 高 级 功能 。 





3.16 /dev/fd 


较 新 的 系统 都 提供 名 为 /dev/fd 的 目录 ， 其 目录 项 是 名 为 0、1、2 等 
的 文件 。 打 开 文 件 /devwfdm 等 效 于 复制 描述 符 n《〈 假 定 描述 符 n 是 打开 


的 ) 。 

/dev/fd 这 一 功能 是 由 Tom Duff 开 发 的 ， 它 首先 出 现在 Research 
UNIX 系 统 的 第 8 版 中 ， 本 书 说 明 的 所 有 4 种 系统 (FreeBSD 8.0、Linux 
3.2.0. Mac OS X 10.6.8 和 Solaris 10) 都 支持 这 一 功能 。 它 不 是 POSIX.1 
的 组 成 部 分 。 

在 下 列 函 数 调用 中 : 

fd = open("/dev/fd/0", mode); 

大 多 数 系 统 忽略 它 所 指定 的 mode， 而 另外 一 些 系统 则 要 求 mode 必 
须 是 所 引用 的 文件 〈 在 这 里 是 标准 输入 ) 初始 打开 时 所 使 用 的 打开 模式 
的 一 个 子 集 。 因 为 上 面 的 打开 等 效 于 

fd = dup(0); 

所 以 摘 述 符 0 和 fd 共享 同一 文件 表 项 〈 见 图 3-9) 。 例 如 ， 大 描述 符 0 
先前 被 打开 为 只 读 ， 那 么 我 们 也 只 能 对 fd 进行 读 操 作 。 即 使 系统 忽略 打 
开 模 式 ， 而 且 下 列 调用 是 成 功 的 : 

fd = open("/dev/fd/0", O_RDWR); 

我 们 仍然 不 能 对 fd 进行 写 操作 。 

Linux 实 现 中 的 /dev/fd 是 个 例外 。 它 把 文件 搬 述 符 映射 成 指 癌 底 层 
物理 文件 的 符号 链接 。 例 如 ， 当 打开 /dewfd/0 时 ， 事 实 上 正在 打开 与 标 
准 输入 关联 的 文件 ， 因 此 返回 的 新 文件 描述 符 的 模式 与 /rdewfd 文 件 描述 
符 的 模式 其 实 并 不 相关 。 

我 们 也 可 以 用 /dewfd 作 为 路 径 名 参数 调用 creat， 这 与 调用 open 时 用 
O_CREAT 作 为 第 2 个 参数 作用 相同 。 例 如 ， 知 一 个 程序 调用 creat， 并 且 
路 径 名 参数 是 /dev/fd/1， 那 么 该 程序 仍 能 工作 。 

注意 ， 在 Linux 上 这 么 做 必须 非常 小 心 。 因 为 Linux 实 现 使 用 指 癌 实 
际 文件 的 符号 链接 ， 在 /dev/fd 文 件 上 使 用 creat 会 导致 底层 文件 被 截断 。 

某 些 系统 提供 路 径 名 /devstdin、/dewstdout 和 /dewstderr， 这 些 等 效 
于 /dev/fd/0、/dev/fd/1 和 和 /dev/fd/2。 

/dev/fd 文 件 主要 由 shell 使 用 ， 它 允许 使 用 路 径 名 作为 调用 参数 的 程 
序 ， 能 用 处 理 其 他 路 径 名 的 相同 方式 处 理 标准 输入 和 输出 。 例 如 ， 
cat(]) 命 令 对 其 命令 行 参 数 采 取 了 一 种 特殊 处 理 ， 它 将 单独 的 一 个 字 








符 “-” 解 释 为 标准 输入 。 例 如 : 

filter file2 | cat filel - file3 | lpr 

上 自 先 cat 读 他 el， 接 着 读 其 标准 输入 (也 就 古 filter file2 命 令 的 输 
出 )， 然 后 读 fle3， 如 果 支 持 /dev/fd， 则 可 以 删除 cat 对 “-” 的 特殊 人 处理， 
于 是 我 们 就 可 键入 下 列 命令 行 : 

filter file2 | cat filel /dev/fd/0 file3 | lpr 

作为 命令 行 参数 的 “-” 特 指标 准 输入 或 标准 输出 ， 这 已 由 很 多 程序 
采用 。 但 是 这 会 带 来 一 些 问题 ， 例 如 ， 如 果 用 “-” 指 定 第 一 个 文件 ， 那 
么 看 来 就 像 指 定 了 命令 行 的 一 个 选项 。/dev/fd 则 提高 了 文件 名 参数 的 一 
致 性 ， 也 更 加 清晰 。 








3.17 小 结 


本 章 说 明了 UNIX 系 统 提供 的 基本 LO 函数 。 因 为 read 和 write 都 在 内 
核 执 行 ， 所 以 称 这 些 函 数 为 不 带 缓冲 的 VO 函数 。 在 只 使 用 read 和 write 情 
况 下 ， 我 们 观察 了 不 同 的 VO 长 度 对 读 文件 所 需 时 间 的 影响 。 我 们 也 观 
ee ee 以 及 它们 对 应 用 程序 性 
能 的 影响 。 

在 说 明 多 个 进程 对 同一 文件 进行 追加 写 操作 以 及 多 个 进程 创建 同一 
文件 时 ， 本 章 介绍 了 原子 操作 。 也 介绍 了 内 核 用 来 共享 打开 文件 信息 的 
数据 结构 。 在 本 书 的 稍 后 还 将 涉及 这 些 数据 结构 。 

我 们 还 介绍 了 ioctl 和 fcntl 函 数 ， 本 书后 续 部 分 还 会 涉及 这 两 个 函 
数 。 第 14 章 还 将 fcntl 用 于 记录 锁 ， 第 18 章 和 第 19 章 将 ioctl 用 于 终端 设 
备 。 











习题 





3.1 当 读 / 写 磁盘 文件 时 ， 本 章 中 描述 的 函数 确实 是 不 融 绥 冲 机 制 的 
吗 ? 请 说 明 原 因 。 

3.2 ”编写 一 个 与 3.12 市 中 dup2 功 能 相同 的 函数 ， 要 求 不 调用 fcntl 函 
数 ， 并 且 要 有 正确 的 出 错 处 理 。 

3.3 假设 一 个 进程 执行 下 面 3 个 函数 调用 : 

fd1 = open(path, oflags); 

fd2 = dup(fd1); 

fd3 = open(path, oflags); 

画 出 类 似 于 图 3-9 的 结果 图 。 对 fcntl 作 用 于 fd1 来 说 ，F_SETFD 命 令 
会 影响 哪 一 个 文件 描述 人 符 ?F_SETFL 呢 ? 

3.4 许多 程序 中 都 包含 下 面 一 段 代 码 : 

dup2(fd, 0); 

dup2(fd, 1); 

dup2(fd, 2); 

if (fd > 2) 

close(fd); 

为 了 说 明 话 语句 的 必要 性 ， 假 设 fq 是 1， 画 出 每 次 调用 dup2 时 3 个 描 
述 符 项 及 相应 的 文件 表 项 的 变化 情况 。 然 后 再 画 出 fd 为 3 的 情况 。 

3.5 在 Bourne shell, Bourne-again ”shell 和 Korn ”shell 中， 
digit1>&digit2 表 示 要 将 描述 符 digit1 重 定向 至 描述 符 digit2 的 同一 文件 。 
请 说 明 下 面 两 条 命令 的 区 别 。 

/a.out > outfile 2>&1 

/a.out 2>&1 > outfile 

(fem: shell 从 左 到 右 处 理 命令 行 。) 

3.6 ”如果 使 用 追加 标志 打开 一 个 文件 以 便 读 、 写 ， 能 侣 仍 用 lseek 在 
任 一 位 置 开始 读 ? 能 人 否 用 lseek 更 新 文件 中 任 一 部 分 的 数据 ? 请 编写 一 段 
程序 验证 。 








4.1 引言 


上 一 章 我 们 次 明了 执行 IO 操作 的 基本 函数 ， 其 中 的 讨论 是 围 经 普 
通 文件 IO 进行 的 一 打开 文件 、 该 文件 或 写 文 件 。 本 章 将 描述 文件 系统 
的 其 他 特征 和 文件 的 性 质 。 我 们 将 从 stat 函 数 开始 ， 逐 个 说 明 stat 结 构 的 
每 一 个 成 员 以 了 解 文 件 的 所 有 属性 。 在 此 过 程 中 ， 我 们 将 说 明 修改 这 些 
属性 的 各 个 函数 更改 所 有 者 、 更 改 权 限 等 ) ， 还 将 更 详细 地 说 明 
UNIX 文 件 系统 的 结构 以 及 符号 链接 。 本 章 最 后 介绍 对 目录 进行 操作 的 
各 个 函数 ， 并 且 开 发 了 一 个 以 降序 遇 历 目录 层次 结构 的 函数 。 











本 章 主 要 讨论 4 个 stat 函 数 以 及 它们 的 返回 信息 。 

#include <sys/stat.h> 

int stat(const char *restrict pathname, struct stat *restrict buf); 

int fstat(int fd, struct stat *buf); 

int Istat(const char *restrict pathname, struct stat *restrict buf); 

int fstatat(int fd, const char *restrict pathname, struct stat *restrict buf, 
int flag); 

所 有 4 个 函数 的 返回 值 : AA; 返回 0; 大 出 错 ， 返 回 -1 

一 旦 给 出 pathname，stat 函 数 将 返回 与 此 命名 文件 有 关 的 信息 结 
构 。fstat 疯 数 获得 已 在 摘 述 符 fd 上 打开 文件 的 有 关 信 息 。]stat 函 数 类 似 
于 stat， 但 是 当 命 名 的 文件 是 一 个 符号 链接 时 ，l]stat 返 回 该 人 特写 链接 的 有 
关 信 息 ， 而 不 是 由 该 符 写 链接 引用 的 文件 的 信息 。【〔 在 4.22 市 中 ， 当 以 
， 目录 层次 结构 时 ， 需 要 用 到 ]stat。4.17 节 将 更 详细 地 说 明 符 号 
连接 。 ) 

fstatat 函 数 为 一 个 相对 于 当前 打开 目录 (由 fd 参数 指向 ) 的 路 径 名 
返回 文件 统计 信息 。flag 参 数控 制 着 是 否 跟随 着 一 个 符号 链接 。 当 
AT_SYMLINK_NOFOLLOW 标 志 被 设置 时 ，fstatat 不 会 跟随 符号 链接 ， 
而 是 返回 符号 链接 本 喘 的 信息 。 人 否则 ， 在 默认 情况 下 ， 返 回 的 是 符号 链 
接 所 指 辐 的 实际 文件 的 信息 。 如 采 fd 参 数 的 值 是 AT_FDCWD， 并 且 
pathname 人 参数 是 一 个 相对 路 径 名 ， fstatat 会 计算 相对 于 当前 目录 的 
pathname 参 数 。 如 果 pathname 是 一 个 绝对 路 径 ，fq 参 数 就 会 被 忽略 。 这 
两 种 情况 下 ， 根 据 flag 的 取 值 ，fstatat 的 作用 就 跟 stat 或 lstat 一 样 

第 2 个 参数 buf 是 一 个 指针 ， 它 指向 一 个 我 们 必须 提供 的 结构 。 函 数 
来 填充 由 buf 指 回 的 结构 。 结 构 的 实际 定义 可 能 随 有 具体 实现 有 上 所 不 同 ， 
但 其 基本 形式 是 : 

struct stat { 




















mode t st_mode; /* file type & mode 
(permissions) */ 

ino_t st_ino; /* j-node number (serial 
number) */ 

dev_t st_dev; /* device number (file 


system) */ 


dev_t st_rdev; /* device number for special 


files */ 
nlink t st_nlink; /* number of links */ 
uid_t st_uid; /* user ID of owner */ 
gid _t st_gid; /* group ID of owner */ 
off_t st_size; /* size in bytes, for regular 
files */ 
struct timespec st_atime; /* time of last access */ 
struct timespec st_mtime; /* time of last modification */ 
struct timespec st_ctime; /* time of last file status change 
*/ 
blksize_t st_blksize; /* best I/O block size */ 
blkcnt_t st_blocks; /* number of disk blocks 
allocated */ 
上 


POSIX.1 未 要 求 st_rdev、st_blksize 和 st_blocks 字 段 。Single UNIX 
Specification XSI 扩 展 定 义 了 这 些 字段 。 

timespec 结 构 类 型 按照 秒 和 纳 秒 定义 了 时 间 ， 至 少 包 括 下 面 两 个 字 
Bt: 


time_t tv_sec; 

long tv_nsec; 

在 2008 年 版 以 前 的 标准 中 ， 时 间 字 上 段 定 义 成 st_atime、st_mtime 以 及 
st_ctime， 它 们 都 是 time_t 类 型 的 (以 秒 来 表示 ) 。timespec 结 构 提 供 了 
更 高 精度 的 时 间 惟 。 为 了 保持 兼容 性 ， 旧 的 名 字 可 以 定义 成 tv_sec 成 
员 。 例 如 ，st_atime 可 以 定义 成 st_atim.tv_sec。 

注意 ，stat 结 构 中 的 大 多 数 成 员 都 是 基本 系统 数据 类 型 〈 见 2.8 
节 ) 。 我 们 将 说 明 此 结构 的 每 个 成 员 以 了 解 文件 属性 。 

使 用 stat 函数 最 多 的 地 方 可 能 就 是 Is -l 命令 ， 用 其 可 以 获得 有 关 一 
个 文件 的 所 有 信息 。 














4.3 文件 类 型 


至 此 我 们 已 经 介绍 了 两 种 不 同 的 文件 类 型 : 普通 文件 和 目录 。 
UNIX 系统 的 大 多 数 文 件 是 普通 文件 或 目录 ， 但 是 也 有 另外 一 些 文件 类 
型 。 文 件 类 型 包括 如 下 几 种 。 

(1) 普通 文件 (regular file〉。 这 是 最 常用 的 文件 类 型 ， 这 种 文件 
包含 了 某 种 形式 的 数据 。 至 于 这 种 数据 是 文本 还 是 二 进 制 数据 ， 对 于 
oe a ee eee 
EJT HEAT 

个 值得 注意 的 例外 是 二 进 制 可 执行 文件 。 为 了 执行 程序 ， 内 核 必 
须 理解 其 格式 。 所 有 二 进 制 可 执行 文件 都 遵循 一 种 标准 化 的 格式 ， 这 种 
格式 使 内 核能 够 确定 程序 文本 和 数据 的 加 载 位 置 。 

(2) 目录 文件 〈directory file) 。 这 种 文件 包含 了 其 他 文件 的 名 字 
以 及 指 同 与 这 些 文件 有 关 信 息 的 指针 。 对 一 个 目录 文件 具有 读 权 限 的 任 
一 进程 都 可 以 读 该 目录 的 内 容 ， 但 只 有 内 核 可 以 直接 写 目 录 文 件 。 进 程 
必须 使 用 本 章 介绍 的 函数 才能 更 改 目 录 。 

(3) 块 特殊 文件 (block special file〉。 这 种 类 型 的 文件 提供 对 设 
备 〈 如 磁盘 ) 带 绥 冲 的 访问 ， 每 次 访问 以 固定 长 度 为 单位 进行 。 

注意 ，FreeBSD 不 再 文 持 块 特殊 文件 。 对 设备 的 所 有 访问 需要 通过 
字符 特殊 文件 进行 。 

(4) 字符 特殊 文件 (character special file) 。 这 种 类 型 的 文件 提供 
对 设备 不 带 缓冲 的 访问 ， 每 次 访问 长 度 可 变 。 系 统 中 的 所 有 设备 要 么 是 
字符 特殊 文件 ， 要 么 是 块 特 殊 文 件 。 

(5) FIFO。 这 种 类 型 的 文件 用 于 进程 间 通 信 ， 有 时 也 称 为 命名 管 
道 Cnamed pipe) 。15.5 节 将 对 其 进行 说 明 。 

(6) 套 接 字 (socket) 。 这 种 类 型 的 文件 用 于 进程 间 的 网 络 通信 。 
套 接 字 也 可 用 于 在 一 台 特 主机 上 进程 之 间 的 非 网 络 通信 。 第 16 章 将 用 套 
接 字 进行 进程 间 的 通信 。 

(7) 符号 链接 (symbolic link) 。 这 种 类 型 的 文件 指向 另 一 个 文 
件 。4.17 节 将 更 多 地 摘 述 符号 链接 。 

文件 类 型 信息 包含 在 stat 结 构 的 st_mode 成 员 中 。 可 以 用 图 4-1 中 的 宏 
确定 文件 类 型 。 这 些 宏 的 参数 都 是 stat 结 构 中 的 st_mode 成 员 。 
























































S ISREG{ 普通 文件 


S_ISCHR ( 字符 特殊 文件 
S_ISBLK ( 块 特殊 文件 
S ISFIFO() 管道 或 FIFO 
S_ISLNK () 符号 链接 
S_ISSOCK () 套 接 字 
图 4-1 在 <sys/stath> 中 的 文件 类 型 宏 
POSIX.1 人 允许 实现 将 进程 间 通 信 CPC) 对 象 〈 如 消息 队列 和 信和 号 量 


等 ) 说 明 为 文件 。 图 4-2 中 的 宏 可 用 来 从 stat 结构 中 确定 IPC 对 象 的 类 
型 。 这 些 宏 与 图 4-1 中 的 不 同 ， 它 们 的 参数 并 非 st_mode， 而 是 指向 stat 


结构 的 指针 。 
对 象 的 类 型 


) 

S ISDIR() 目录 文件 
) 
) 





S_TYPEISMO () 


S_TYPEISSEM () 
S_TYPEISSHM () 





图 4-2 在 <sys/stat.h> 中 的 IPC 类 型 宏 
消 恩 队列 、 信 号 量 以 及 共 圣 存储 对 象 等 将 在 第 15 章 中 讨论 。 但 
是 ， 本 书 讨论 的 4 种 UNIX 系 统 都 不 将 这 些 对 象 表示 为 文件 。 
实例 
图 4-3 程 序 取 其 命令 行 参数 ， 人 然后 针对 每 一 个 命令 行 参数 打印 其 文 
件 类 型 。 


#include "apue ,hn 


int 
main(int argc, char *argv(]) 
| 

int F 

struct stat buf; 

char *ptr; 


for (1 = 1; 1< argc; itt) { 

printf("ss: ", argv(i]); 

if (Istat(argv(i], &buf) < 0) { 
err ret("Istat error"); 
continue; 

if (S_ISREG (buf. st_mode) ) 
ptr = "regular"; 

else if (S_ISDIR(buf.st_mode) ) 
ptr = "directory"; 

else if ($ ISCHR(buf.st mode) ) 
ptr = "character special"; 

else if ($ ISBLK (buf, st mode) ) 
ptr = "block special"; 

else if (9 ISFIFO(buf.st_mode) ) 
ptr = "fifo"; 

else if ($ ISLNK(buf.st_mode) ) 
ptr = "symbolic link"; 

else if ($ ISSOCK(buf.st_mode) ) 
ptr = "socket"; 

else 
ptr = "** unknown mode **"; 

printf ("$s\n", ptr); 

exit (0); 


图 4-3 对 每 个 命令 行 参数 打印 文件 类 型 


[el] 


图 4-3 程 序 的 示例 输出 是 : 

$ ./a.out /etc/passwd /etc /dev/log /dev/tty \ 

> /var/lib/oprofile/opd_pipe /dev/sr0 /dev/cdrom 

/etc/passwd: regular 

/etc: directory 

/dev/log: socket 

/dev/tty: character special 

/var/lib/oprofile/opd_pipe: fifo 

/dev/sr0: block special 

/dev/cdrom: symbolic link 

(其 中 ， 在 第 一 个 命令 行 末端 我 们 键入 了 一 个 反 斜 杜 ， 通 知 shell 要 

在 下 一 行 继 续 键入 命令 ， 然后， shell 在 下 一 行 上 用 其 辅助 提示 符 > 提 示 
我 们 。) 我 们 特地 使 用 了 lstat 函 数 而 不 是 stat 函 数 以 便 检测 符号 链接 。 如 
各 使 用 stat 函 数 ， 则 不 会 观察 到 符号 链接 。 

早期 的 UNIX 版 本 并 不 提供 S_ISxxx 宏 ， 于 是 就 需要 将 st_mode 与 屏 
浅 字 S_IFMT 进 行 逻辑 “与 运算， 然后 与 名 为 S_IFxxx 的 常量 相 比 较 。 大 
多 数 系统 在 文件 <sys/stat.h> 中 定义 了 此 屏蔽 字 和 相关 的 常量 。 如 寿 查 看 
此 文件 ， 则 可 找到 S_ISDIR 宏 定义 为 : 

#define S_ISDIR (mode) (((mode) & S_IFMT) == S_IFDIR) 

我 们 说 过 ， 普 通 文件 是 最 主要 的 文件 类 型 ， 但 是 观察 一 下 在 一 个 给 
定 的 系统 中 各 种 文件 的 比例 是 很 有 意思 的 。 图 4-4 显 示 了 在 一 个 单 用 户 
n 统 中 的 统计 值 和 百分比 。 这 些 数 据 是 由 4.22 节 中 的 程序 得 

IHJ o 


文件 类 型 统计 值 百分比 (%) 


普通 文件 415 803 
目录 62 197 








符号 链接 40 018 


字符 特殊 

块 特殊 47 
套 接 字 

FIFO 











图 4-4 不 同类 型 文件 的 统计 值 和 百分比 


4.4 设置 用 户 ID 和 议 置 组 ID 


与 一 个 进程 相关 联 的 ID 有 6 个 或 更 多 ， 如 图 4-5 所 示 。 





实际 用 户 ID 
实际 组 ID 
有 效用 户 ID 


有 效 组 ID 用 于 文件 访问 权限 检查 
附属 组 ID 

有 存 的 设置 用 户 ID 
采 存 的 设置 组 ID 


HH exec 函数 保存 








图 4-5 与 每 个 进程 相关 联 的 用 户 ID 和 组 ID 

实际 用 户 ID 和 实际 组 ID 标识 我 们 究竟 是 谁 。 这 两 个 字段 在 登录 时 
取 自 口令 文件 中 的 登录 项 。 通 常 ， 在 一 个 登录 会 话 期 间 这 些 值 并 不 改 
变 ， 但 是 超级 用 户 进程 有 方法 改变 它们 ， 8.11 节 将 说 明 这 些 方法 。 

“有 效用 户 ID、 有 效 组 ID 以 及 附属 组 ID 决 定 了 我 们 的 文件 访问 权 
限 ， 下 一 节 将 对 此 进行 说 明 (我 们 已 在 1.8 节 中 说 明了 附属 组 ID) 。 

“保存 的 设置 用 户 ID 和 保存 的 设置 组 ID 在 执行 一 个 程序 时 包含 了 有 
效用 户 ID 和 有 效 组 ID 的 副本 ， 在 8.11 节 中 说 明 setuid 函 数 时 ， 将 说 明 这 
两 个 保存 值 的 作用 。 

在 POSIX.1 ”2001 年 版 中 ， 要 求 这 些 保存 的 ID。 在 早期 POSIX 版 本 
中 ， 它 们 是 可 选 的 。 一 个 应 用 程序 在 编译 时 可 测试 常量 
_POSIX_SAVED _IDS， 或 在 运行 时 以 参数 SC_SAVED_IDS 调 用 函数 
sysconf， 以 判断 此 实现 是 否 文 持 这 一 功能 。 

通常 ， 有 效用 户 ID 等 于 实际 用 户 ID， 有 效 组 ID 等 于 实际 组 ID。 

每 个 文件 有 一 个 所 有 者 和 组 所 有 者 ， 所 有 者 由 stat 结 构 中 的 st_uid 指 
定 ， 组 所 有 者 则 由 st_gid 指 定 。 

当 执 行 一 个 程序 文件 时 ， 进 程 的 有 效用 户 ID 通 常 就 是 实际 用 户 ID， 
有 效 组 ID 通常 是 实际 组 ID。 但 是 可 以 在 文件 模式 字 〈stmode) 中 设置 
一 个 特殊 标志 ， 其 含义 是 “ 当 执 行 此 文件 时 ， 将 进程 的 有 效用 户 ID 设 置 























为 文件 所 有 者 的 用 户 ID Cst uid) ”。 与 此 相 类 似 ， 在 文件 模式 字 中 可 以 
设置 另 一 位 ， 它 将 执行 此 文件 的 进程 的 有 效 组 ID 设置 为 文件 的 组 所 有 者 
ID (st_gid) 。 在 文件 模式 字 中 的 这 两 位 被 称 为 设置 用 户 ID (set-user- 
ID) 位 和 设置 组 ID (set-group-ID) 位 。 

例如 ， 知 文件 所 有 者 是 超级 用 户 ， 而 且 设 置 了 该 文件 的 设置 用 户 
ID ” 位， 那么 当 访 程序 文件 由 一 个 进程 执行 时 ， 该 进程 具有 超级 用 户 权 
限 。 不 管 执行 此 文件 的 进程 的 实际 用 户 D 是 什么 ， 都 会 是 这 样 。 例 
W, UNIX 系统 程序 passwd(1) 人 允许 任 一 用 户 改 变 其 口令 ， 该 程序 是 一 个 
设置 用 户 D 程序 。 因 为 该 程序 应 能 将 用 户 的 新 口令 写 入 口令 文件 中 
(一 般 是 /etc/passwd 或 /etc/shadow) ， 而 只 有 超级 用 户 才 具有 对 该 文件 
的 写 权 限 ， 所 以 需要 使 用 设置 用 户 ID 功能 。 因 为 运行 设置 用 户 ID 程序 
的 进程 通常 会 得 到 和 额外 的 权限 ， 所 以 编写 这 种 程序 时 要 特别 谨慎 。 第 8 
章 将 更 详细 地 讨论 这 种 类 型 的 程序 。 

再 回 到 stat 函 数 ， 设 置 用 户 ID 位 及 设置 组 ID 位 都 包含 在 文件 的 
st_mode 值 中 。 这 两 位 可 分 别 用 常量 S_ISUID 和 S_ISGID 测 试 。 
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st_mode 值 也 包含 了 对 文件 的 访问 权限 位 。 当 提 及 文件 时 ， 指 的 是 
前 面 所 提 到 的 任何 类 型 的 文件 。 所 有 文件 类 型 (目录 、 字 符 特别 文件 
等 ) 都 有 访问 权限 (access permission) 。 很 多 人 认为 只 有 普通 文件 有 访 
问 权 限 ， 这 是 一 种 误解 。 

每 个 文件 有 9 个 访问 权限 位 ， 可 将 它们 分 成 3 类 ， 见 图 4-6。 


st mode PF ix 


S IRUSR 

S IWUSR 

S IXUSR 

S IRGRP 

S IWGRP 

S IXGRP 

S IROTH 其 他 读 

S_IWOTH 其 他 写 

S_IXOTH 其 他 执行 

图 4-6 9 个 访问 权限 位 ， 取 自 <sys/stat.h> 
在 图 4-6 前 3 行 中 ， 术 语 用 户 指 的 是 文件 所 有 者 (owner) 。 

chmod(1) 命 令 用 于 修改 这 9 个 权限 位 。 该 命令 允许 我 们 用 u 表 示 用 户 〈( 所 
有 者 ) ， 用 g 表 示 组 ， 用 o 表 示 其 他 。 有 些 书 把 这 3 种 用 户 类 型 分 别称 为 


所 有 者 、 组 和 世界 。 这 会 造成 混乱 ， 因 为 comod 命令 用 o 表 示 其 他 ， 而 
人 我 们 将 使 用 术语 用 户 、 组 和 其 他 ， 以 便 与 chmod 命 令 保持 
— 7 > 


图 4-6 中 的 3 类 访问 权限 《“ 即 读 、 写 及 执行 ) 以 各 种 方式 由 不 同 的 函 
数 使 用 。 我 们 将 这 些 不 同 的 使 用 方式 汇总 在 下 面 。 当 说 明 相 关 函 数 时 ， 
再 进一步 讨论 。 











第 一 个 规则 是 ， 我 们 用 名 字 打 开 任 一 类 型 的 文件 时 ， 对 该 名 字 中 
包含 的 每 一 个 目录 ， 包 括 它 可 能 隐 含 的 当前 工作 目录 都 应 具有 执行 权 
限 。 这 就 是 为 什么 对 于 目录 其 执行 权限 位 常 被 称 为 搜索 位 的 原因 。 

例如 ， 为 了 打开 文件 /usr/include/stdio.h， 需 要 对 目录 /、/usr 
和 /usrinclude 具 有 执行 权限 。 然 后 ， 需 要 具有 对 文件 本 身 的 适当 权限 ， 
这 取决 于 以 何 种 模式 打开 它 〈 只 读 、 读 - 写 等 ) 。 

如 果 当 前 目录 是 /usr/include， 那 么 为 了 打开 文件 stdio.h， 需 要 对 当 
前 目录 有 执行 权限 。 这 是 隐 含 当前 目录 的 一 个 示例 。 打 开 stdio.h 文 件 与 
打开 ./stdio.h 作 用 相同 。 注 意 ， 对 于 目录 的 读 权 限 和 执行 权限 的 意义 是 
不 相同 的 。 读 权限 允许 我 们 读 目 录 ， 获 得 在 该 目录 中 所 有 文件 名 的 列 
表 。 当 一 个 目录 是 我 们 要 访问 文件 的 路 径 名 的 一 个 组 成 部 分 时 ， 对 该 目 
录 的 执行 权限 使 我 们 可 通过 该 目录 〈 也 就 是 搜索 该 目录 ， 寻 找 一 个 特定 
的 文件 名 ) 。 引 用 隐 仿 目录 的 另 一 个 例子 是 ， 如 果 PATH 环 境 变量 
(8.10 节 将 对 其 进行 说 明 〉 指定 了 一 个 我 们 不 具有 执行 权限 的 目录 ， 那 
么 shell 绝 不 会 在 该 日 录 下 找到 可 执行 文件 。 

* 对 于 一 个 文件 的 读 权 限 决 定 了 我 们 是 否 能 够 打开 现 有 文件 进行 读 
操作 。 这 与 open 函 数 的 O_RDONLY 和 O_RDWR 标志 相关 。 

对 于 一 个 文件 的 写 权 限 决 定 了 我 们 是 否 能 够 打开 现 有 文件 进行 写 
操作 。 这 与 open 函 数 的 O_WRONLY 和 O_RDWR 标志 相关 。 

“为 了 在 open 函 数 中 对 一 个 文件 指定 O_TRUNC 标 志 ， 必 须 对 该 文件 
具有 写 权 限 。 

为 了 在 一 个 目录 中 创建 一 个 新 文件 ， 必 须 对 该 目录 具有 写 权限 和 
执行 权限 。 

为 了 删除 一 个 现 有 文件 ， 必 须 对 包含 该 文件 的 目录 具有 写 权 限 和 
执行 权限 。 对 该 文件 本 身 则 不 需要 有 读 、 写 权限 。 

如 果 用 7 个 exec 函 数 〈 见 8.10 节 ) 中 的 任何 一 个 执行 某 个 文件 ， 都 
必须 对 该 文件 具有 执行 权限 。 该 文件 还 必须 是 一 个 普通 文件 。 

进程 每 次 打开 、 创 建 或 删除 一 个 文件 时 ， 内 核 就 进行 文件 访问 权限 
测试 ， 而 这 种 测试 可 能 涉及 文件 的 所 有 者 〈st_uid 和 st_gid) 、 进 程 的 有 
效 ID 〈 有 效用 户 ID 和 有 效 组 ID ) 以 及 进程 的 附属 组 ID 〈 若 支持 的 
TH) 。 两 个 所 有 者 ID 是 文件 的 性 质 ， 而 两 个 有 效 ID 和 附属 组 ID 则 是 进程 
的 性 质 。 内 核 进行 的 测试 具体 如 下 。 

Gd) 若 进 程 的 有 效用 户 ID 是 0〈 超 级 用 户 ) ， 则 人 允许 访问 。 这 给 矛 
了 超级 用 户 对 整个 文件 系统 进行 处 理 的 最 充分 的 自由 。 

(2) 知 进 程 鸭 有效 用户 ID 等 于 文件 的 所 有 者 ID 〈 也 就 是 进程 拥有 
此 文件 ) ， 那 么 如 果 所 有 者 适当 的 访问 权限 位 被 设置 ， 则 人 允许 访问 ; 否 
则 拒绝 访问 。 适 当 的 访问 权限 位 指 的 是 ， 若 进程 为 读 而 打开 该 文件 ， 则 





































































































用 户 读 位 应 为 1， 知 进程 为 写 而 打开 该 文件 ， 则 用 户 写 位 应 为 1， 知 进程 
将 执行 该 文件 ， 则 用 户 执行 位 应 为 1。 

(3) 在 进程 的 有 效 组 ID 或 进程 的 附属 组 ID 之 一 等 于 文件 的 组 ID， 
那么 如 果 组 适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ; 否则 拒绝 访问 。 
(4) 大 其 他 用 户 适 当 的 访问 权限 位 被 设置 ， 则 允许 访问 ;否则 拒 
绝 访问 。 

按 顺 序 执行 这 4 步 。 注 意 ， 如 果 进 程 拥有 此 文件 (第 2 步 ) ， 则 按 
用 户 访 问 权 限 批准 或 拒绝 该 进程 对 文件 的 访问 一 不 查看 组 访问 权限 。 类 
似 地 ， 大 进程 并 不 拥有 该 文件 。 但 进程 属于 某 个 适当 的 组 ， 则 按 组 访问 
权限 批准 或 拒绝 该 进程 对 文件 的 访问 一 个 碍 看 其 他 用 户 的 访问 权限 。 
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在 第 3 章 中 讲述 用 open 或 creat 创 建新 文件 时 ， 我 们 并 没有 说 明 赋 予 
新 文件 的 用 户 ID 和 组 ID 是 什么 。4.21 节 将 说 明 mkdir 函 数 ， 此 时 就 会 了 
解 如 何 创建 一 个 新 目录 。 关 于 新 目录 的 所 有 权 规 则 与 本 节 将 说 明 的 新 文 
件 所 有 权 规 则 相同 。 

新 文件 的 用 户 ID 设 置 为 进程 的 有 效用 户 ID。 关 于 组 ID，POSIX.1 人 允 
许 实现 选择 下 列 之 一 作为 新 文件 的 组 ID。 

C1) 新 文件 的 组 ID 可 以 是 进程 的 有 效 组 ID。 

(2) 新 文件 的 组 ID 可 以 是 它 所 在 目录 的 组 ID。 

FreeBSD 8.0 和 Mac OS X 10.6.8 总 是 使 用 目录 的 组 ID 作为 新 文件 的 
组 ID。 有 些 Linux 文 件 系统 使 用 mount(1) 命 令 选 项 允许 在 POSIX.1 提出 
的 两 种 选项 中 进行 选择 。 对 于 Linux 3.2.0 和 Solaris 10， 默 认 情 况 下 ， 新 
文件 的 组 ID 取 诀 于 它 所 在 的 目录 的 设置 组 ID 位 是 否 被 设置 。 如 果 该 目录 
的 这 一 位 已 经 被 设置 ， 则 新 文件 的 组 ID 设置 为 目录 的 组 ID; 否则 新 文件 
的 组 ID 设置 为 进程 的 有 效 组 ID。 

使 用 POSIX.1 所 允许 的 第 三 个 选项 (继承 目录 的 组 ID) 使 得 在 某 个 
目录 下 创建 的 文件 和 目录 都 具有 该 目录 的 组 ID。 于 是 文件 和 目录 的 组 所 
有 权 从 该 点 向 下 传递 。 例 如 ， 在 Linux 的 /var/mail 目 录 中 就 使 用 了 这 种 方 


法 。 

正如 前 面 提 到 的 ， 这 种 设置 组 所 有 权 的 方法 是 FreeBSD 8.0 和 Mac 
OS X ”10.6.8 系 统 默 认 的 ， 但 对 于 Linux 和 Solaris 则 是 可 选 的 。 在 Linux 
3.2.0 和 Solaris 10:2 下， 必须 使 设置 组 ID 位 起 作用 。 更 进一步 ， 为 使 这 种 
方法 能 够 正常 工作 ，mkdir 函 数 要 自动 地 传递 一 个 目录 的 设置 组 ID 位 
(4.21 节 将 说 明 mkdir 就 是 这 样 做 的 ) 。 




















4.7 贞 效 access 利 faccessat 


正如 前 面 所 说 ， 当 用 open 气 数 打开 一 个 文件 时 ， 内 核 以 进程 的 有 
效用 户 ID 和 有 效 组 ID 为 基础 执行 其 访问 权限 测试 。 有 时 ， 进 程 也 希望 
按 其 实际 用 户 ID 和 实际 组 ID 来 测试 其 访问 能 力 。 例 如 ， 当 一 个 进程 使 用 
设置 用 户 ID 或 设置 组 ID 功能 作为 另 一 个 用 户 〈 或 组 ) 运行 时 ， 就 可 能 会 
有 这 种 需要 。 即 使 一 个 进程 可 能 已 经 通过 设置 用 户 ID 以 超级 用 户 权 限 运 
行 ， 它 仍 可 能 想 验证 其 实际 用 户 能 人 否 访问 一 个 给 定 的 文件 。access 和 
faccessat 函 数 是 按 实际 用 户 ID 和 实际 组 ID 进行 访问 权限 测试 鸭 。“《 该 测 
试 也 分 成 4 步 ， 这 与 4.5 节 中 所 述 的 一 样 ， 但 将 有 效 改 为 实际 。) 

#include <unistd.h> 

int access(const char *pathname, int mode); 

int faccessat(int fd, const char *pathname, int mode, int flag); 

两 个 函数 的 返回 值 : 大 成 功 ， 返 回 0; Abe, el- 

其 中 ， 如 果 测 试 文件 是 否 已 经 存在 ，mode 就 为 FE_OK; 否则 mode 是 
图 4-7 中 所 列 常量 的 按 位 或 。 


R OK 测试 读 权 限 














W OK 测试 写 权 限 
X OK 测试 执行 权限 





图 4-7 access 函 数 的 mode 标 志 ， 取 自 <unistd.h> 

faccessat 函 数 与 access 函 数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 
pathname 参 数 为 绝对 路 径 ， 另 一 种 是 fd 参数 取 值 为 AT_FDCWD 而 
pathname 参 数 为 相对 路 径 。 人 否则 ，faccessat 计 算 相 对 于 打开 目录 CH fd 
参数 指向 ) 的 pathname。 

flag 参 数 可 以 用 于 改变 faccessat 的 行为 ， 如 果 flag 设 置 为 
AT_EACCESS， 访 问 检 查 用 的 是 调用 进程 的 有 效用 户 ID 和 有 效 组 ID， 
ee 

SE fl 


图 4-8 显 示 了 了 access 函数 的 使 用 方法 。 


#include "apue 
tinclude <fcnt1.h> 


int 
main(int argc, char *argv{]) 
| 
if (argc != 2) 
err quit("usage: a.out <pathname>") ; 
if (access (argv[1], ROK) < 0) 
err ret("access error for $s", argv[1]); 
else 
printf ("read access OK\n"); 
1f (open(argv(1], O_RDONLY) < 0) 
err ret ("open error for %s", argv(1]); 
else 
printf ("open for reading OK\n"); 
exit (0); 





下 面 是 该 程序 的 示例 会 话 : 

$ Is -l a.out 

-TWXrWXIr-X 1 sar 15945 Nov 30 12:10 a.out 

$ ./a.out a.out 

read access OK 

open for reading OK 

$ Is -l /etc/shadow 

-[-------- 1 root 1315 Jul 17 2002 /etc/shadow 
图 4-8 access 函 数 实例 

$ ./a.out /etc/shadow 

access error for /etc/shadow: Permission denied 


open error for /etc/shadow: Permission denied 


$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 

# chown root a.out 将 文件 用 户 ID 改 为 root 

# chmod u+s a.out 并 打开 设置 用 户 ID 位 

# ls -l a.out 检查 所 有 者 和 SUID 位 
-TWSIWXI-X 1 root 15945 Nov 30 12:10 a.out 
# exit 恢复 为 正常 用 户 


$ ./a.out /etc/shadow 

access error for /etc/shadow: Permission denied 

open for reading OK 

在 本 例 中 ， 尽 管 open 函 数 能 打开 文件 ， 但 通过 设置 用 户 ID 程序 可 以 
确定 实际 用 户 不 能 正常 读 指定 的 文件 。 

在 上 例 及 第 8 章 中 ， 我 们 有 时 要 成 为 超级 用 户 ， 以 便 演 示 某 些 功 能 
是 如 何 工 作 的 。 如 果 你 使 用 多 用 户 系统 ， 但 无 超级 用 户 权 限 ， 那 么 你 就 
不 能 完整 地 重复 这 些 实例 。 





4.8 K Bumask 


至 此 我 们 已 说 明了 与 每 个 文件 相关 联 的 9 个 访问 权限 位 ， 在 此 基础 
上 我 们 可 以 说 明 与 每 个 进程 相关 联 的 文件 模式 创建 屏蔽 字 。 

umask ”函数 为 进程 设置 文件 模式 创建 屏蔽 字 ， 并 返回 之 前 的 值 。 

(这 是 少数 几 个 没有 出 错 返 回 函 数 中 的 一 个 。) 
#include <sys/stat.h> 
mode_t umask(mode_t cmask); 
返回 值 : 之 前 的 文件 模式 创建 屏蔽 字 

其 中 ， 参 数 cmask 是 由 图 4-6 中 列 出 的 9 个 常量 (S_IRUSR、 
S_IWUSR 等 ) 中 的 徊 干 个 按 位 "或 构成 的 。 

在 进程 创建 一 个 新 文件 或 新 目录 时 ， 就 一 定 会 使 用 文件 模式 创建 屏 
Wee CAI 3.3 节 和 3.4 节 ， 在 那里 我 们 说 明了 open 和 creat 函 数 。 这 两 个 
函数 都 有 一 个 参数 mode， 它 指定 了 新 文件 的 访问 权限 位 〉。 我 们 将 在 
4.21 节 说 明 如 何 创 建 一 个 新 目录 。 在 文件 模式 创建 屏蔽 字 中 为 1 的 位 ， 
nee eee : 

KH 

图 4-9 程 序 创建 了 两 个 文件 ， 创 建 第 一 个 时 ，umask 值 为 0， 创 建 第 
二 个 时 ，umask 值 禁止 所 有 组 和 其 他 用 户 的 访问 权限 。 





#include "apue.h" 
tinclude <fontl.h> 


#define RWRWRW (S_IRUSR|S_IWUSR|S_IRGRP|S_IWGRP|S_IROTH|S_IWOTH) 


int 
main (void) 
| 
umask (0) ; 
if (creat ("foo", RWRWRW) < 0) 
err sys("creat error for foo"); 
umask($ IRGRP | 9 IWGRP | S IROTH | S_IWOTH); 
lf (creat ("bar", RWRWRW) < 0) 
err sys("creat error for bar"); 
exit (0); 


图 4-9 umask K BL SE fi) 


在 运行 此 程序 可 得 如 下 结 末 ， 从 中 可 见 访问 权限 位 是 如 何 设置 的 。 








$umask 先 打 印 当 前 文件 模式 创建 屏蔽 字 
-TW------- 1 sar 0 Dec 7 21:20 bar 

-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 

002 

$ ./a.out 

$ ls -l foo bar 

$ umask WEE MFE NRE E BF WCE TE 
002 


UNIX 系 统 的 大 多 数 用 户 从 不 处 理 他 们 的 umask 值 。 通 党 在 登录 时 ， 
由 shell 的 局 动 文件 设置 一 次 ， 然 后 ， 再 不 改变 。 尺 管 如 此 ， 当 编写 创建 
新 文件 的 程序 时 ， 如 果 我 们 想 确 保 指 定 的 访问 权限 位 已 经 激活 ， 那 么 必 
须 在 进程 运行 时 修改 umask 值 。 例 如 ， 如 果 我 们 想 确保 任何 用 户 痢 能 读 








文件 ， 则 应 将 umask 设 置 为 0。 否 则 ， 当 我 们 的 进程 运行 时 ， 有 效 的 
umask 值 可 能 关闭 该 权限 位 。 

在 前 面 的 示例 中 ， 我 们 用 shell 的 umask 命 令 在 运行 程序 的 前 、 后 打 
印 文件 模式 创建 屏蔽 字 。 从 中 可 见 ， 更 改进 程 的 文件 模式 创建 屏蔽 字 并 
不 影响 其 父 进 程 (常常 是 shell) 的 屏蔽 字 。 所 有 shell 都 有 内 置 umask 命 
令 ， 我 们 可 以 用 该 命令 设置 或 打印 当前 文件 模式 创建 屏蔽 字 。 

用 户 可 以 设置 umask 值 以 控制 他 们 所 创建 文件 的 默认 权限 。 该 值 表 
示 成 八进制 数 ， 一 位 代表 一 种 要 屏蔽 的 权限 ， 这 示 于 图 4-10 中 。 设 置 了 
相应 位 后 ， 它 所 对 应 的 权限 就 会 被 拒 绝 。 常 用 的 几 种 umask 值 是 002、 
022 和 027. 002 阻止 其 他 用 户 写 入 你 的 文件 ，022 阻止 同 组 成 员 和 其 他 
用 户 写 入 你 的 文件 ，027 阻 止 同 组 成 员 写 你 的 文件 以 及 其 他 用 户 读 、 写 
或 执行 你 的 文件 。 














用 户 读 
用 户 写 
用 户 执行 


组 读 


组 写 
组 执行 
其 他 读 
其 他 与 
其 他 执行 
图 4-10 umask 文 件 访问 权限 位 
Single UNIX Specification 要 求 shell 应 该 支持 符号 形式 的 umask 命 
令 。 与 八进制 格式 不 同 ， 符 号 格式 指定 许可 的 权限 〈 即 在 文件 创建 屏蔽 
字 中 为 0 的 位 ) 而 非 拒绝 的 权限 《 即 在 文件 创建 屏蔽 字 中 为 1 的 位 ) 。 下 
面 显 示 了 两 种 格式 的 命令 。 
$ umask 先 打 印 当前 文件 模式 创建 屏蔽 


$umask -S 打印 符号 格式 





RS 


T 


$umask 027 更 改 文 件 模式 创建 屏蔽 字 
$ umask -S 打印 符号 格式 

002 

U=TWX,g=TWX,O=IX 

U=I'WX, 8=Tx,0= 


4.9 函数 chmod、fchmod 和 fchmodat 


chmod、fchmod 和 fchmodat 这 3 个 函数 使 我 们 可 以 更 改 现 有 文件 的 访 
问 权 限 。 

#include <sys/stat.h> 

int chmod(const char *pathname, mode_t mode); 

int fchmod(int fd, mode_t mode); 

int fchmodat(int fd, const char *pathname, mode_t mode, int flag); 

3 个 函数 返回 值 : AND, GIO; Arita, e- 

chmod 函数 在 指定 的 文件 上 进行 操作 ， 而 fchmod 函数 则 对 已 打开 
的 文件 进行 操作 。fchmodat 函 数 与 chmod 函 数 在 下 面 两 种 情况 下 是 相同 
的 : 一 种 是 pathname 参 数 为 绝对 路 径 ， 另 一 种 是 fa 参数 取 值 为 
AT_FDCWD 而 pathname 参 数 为 相对 路 径 。 和 否则 ，fchmodat 计 算 相 对 于 打 
开 目 录 (由 fd 参数 指向 ) 的 pathname。flag 参 数 可 以 用 于 改变 fchmodat 的 
行为 ， 当 设置 了 AT_SYMLINK_NOFOLLOW 标 志 时 ，fchmodat 并 不 会 
跟随 符号 链接 。 

为 了 改变 一 个 文件 的 权限 位 ， 进 程 的 有 效用 户 ID 必须 等 于 文件 的 所 
有 者 ID， 或 者 该 进程 必须 具有 超级 用 户 权限 。 

参数 mode 是 图 4-11 中 所 示 常 量 的 按 位 或 。 








S ISUID 执行 时 设置 用 户 ID 
S_FScrp 执行 时 设置 组 ID 
S_ISVTX 保存 正文 〈 粘 着 位 ) 

用 户 (所 有 者 ) 读 、 写 和 执 

行 

S_IRUSR HP CARA) 读 

S IWUSR 用 户 (所 有 者 ) 写 


S_IRWXU 


S IXUSR 用 户 〈 所 有 者 ) 执行 
S IRWXG 组 读 、 写 和 执行 
S IRGRP 组 读 
S_IWGRP 组 写 
S IXGRP 组 执行 
S IRWXO 其 他 读 、 写 和 执行 
S_IROTH 其 他 读 
S_IWOTH 其 他 写 
S IXOTH 其 他 执行 
图 4-11 chmod 函 数 的 mode 常 量 ， 取 自 <sys/stat.h> 
注意 ， 在 图 4-11 中 ， 有 9 项 是 取 自 图 4-6 中 的 9 个 文件 访问 权限 位 。 我 
们 另外 加 了 6 个 ， 它 们 是 两 个 设置 ID 常量 (S_ ISUID 和 S_ISGID) 、 保 存 
正文 常量 (S_ISVTX) 以 及 3 个 组 合 和 常量 (S_IRWXU、S_IRWXG 和 
S IRWXO) 。 
保存 正文 位 〈S_ISVTX) 不 是 POSIX.1 的 一 部 分 。 在 Single UNIX 
Specification 中 ， 它 被 定义 在 XSI 扩 展 中 。 我 们 在 下 一 节 说 明 其 目的 。 
实例 
为 了 演示 umask 函 数 ， 我 们 在 前 面 运行 了 图 4-9 程 序 ， 先 让 我 们 回忆 
文件 oo 和 bar 当 时 的 最 后 状态 : 

















$ ls -l foo bar 
-TW------- 1 sar 0 Dec 7 21:20 bar 
-tw-rw-rw- 1 sar 0 Dec 7 21:20 foo 


图 4-12 的 程序 修改 了 这 两 个 文件 的 模式 。 


tinclude "apue.h" 


int 
main (void) 
| 
struct stat statbuf; 


/* turn on set-group-ID and turn off group-execute */ 


if (stat("foo", &statbuf) < 0) 
err_sys("stat error for foo"); 

if (chmod("foo", (statbuf.st_mode & ~S IXGRP) | 9 ISGID) < 0) 
err sys("chmod error for foo"); 


/* set absolute mode to "rw-r--r--" */ 


if (chmod("bar", S_IRUSR | 9 IWUSR | S_IRGRP | S_IROTH) < 0) 
err sys("chmod error for bar"); 
exit (0); 


图 4-12 chmod 函 数 实例 
在 运行 图 4-12 程 序 后 ， 这 两 个 文件 的 最 后 状态 是 : 
$ ls -l foo bar 
-rw-r--r-- 1 sar 0 Dec 7 21:20 bar-rw-rwSrw- 1 sar 0 Dec 7 21:20 foo 
在 本 例 中 ， 不 管 文 件 bar 的 当前 权限 位 如 何 ， 我 们 都 将 其 权限 设置 


为 一 个 绝对 值 。 对 文件 foo， 我 们 相对 于 其 当前 状态 设置 权限 。 为 此 ， 
先 调用 stat 获 得 其 当前 权限 ， 然 后 修改 它 。 我 们 显 式 地 打开 了 设置 组 ID 
位 、 关 闭 了 组 执行 位 。 注 意 ，ls 命 令 将 组 执行 权限 表示 为 S， 它 表示 设 
置 组 ID 位 已 经 设置 ， 同 时 ， 组 执行 位 未 设置 。 

在 Solaris 中 ，1s 命 令 显 示 ] 而 非 S， 这 表明 对 该 文件 可 以 加 强制 性 文 
件 或 记录 锁 。 这 只 能 用 于 普通 文件 ，14.3 节 将 更 详细 地 讨论 这 一 点 。 

最 后 还 要 注意 ， 在 运行 图 4-12 程 序 后 ，1s 命 令 列 出 的 时 间 和 日 期 并 
没有 改变 。 在 4.19 节 中 ， 我 们 会 了 解 到 chmod 函数 更 新 的 只 是 i 节点 最 
T a 
容 的 时 间 。 

chmod 函 数 在 下 列 条 件 下 上 自动 清除 两 个 权限 位 。 

Solaris ”等 系统 对 用 于 普通 文件 的 粘着 位 赋予 了 特殊 含义 ， 在 这 些 
系统 上 如 果 我 们 试图 设置 普通 文件 的 粘着 位 〈S_ISVTX) ， 而 且 又 没有 
超级 用 户 权 限 ， 那 么 mode 中 的 粘着 位 自动 被 关闭 〈 我 们 将 在 下 一 节 说 
明 粘 着 位 ) 。 这 意味 着 只 有 超级 用 户 才 能 设置 普通 文件 的 粘着 位 。 这 样 
做 的 理由 是 防止 恶意 用 户 设 置 粘 着 位 ， 由 此 影响 系统 性 能 。 

在 FreeBSD 8.0 和 Solaris 10 中 ， 只 有 超级 用 户 才 能 对 普通 文件 设置 
粘着 位 。Linux 3.2.0 和 Mac OS X 10.6.8 对 设置 粘着 位 并 无 此 种 限制 ， 其 
原因 是 ， 粘 着 位 对 Linux 普 通 文件 并 无 意义 。 虽 然 粘着 位 对 FreeBSD 的 普 
人 

该 位 。 

新 创建 文件 的 组 ID 可 能 不 是 调用 进程 所 属 的 组 。 回 忆 一 下 4.6 
节 ， 新 文件 的 组 ID 可 能 是 父 目 录 的 组 ID。 特 别 地 ， 如 果 新 文件 的 组 ID 
不 等 于 进程 的 有 效 组 ID 或 者 进程 附属 组 ID 中 的 一 个 ， 而 且 进 程 没 有 超 
级 用 户 权 限 ， 那 么 设置 组 ID 位 会 被 自动 被 关闭 。 这 就 防止 了 用 户 创 建 
一 个 设置 组 ID 文件 ， 而 该 文件 是 由 并 非 该 用 户 所 属 的 组 拥有 的 。 

这 种 情况 下 ，FreeBSD 8.0 对 试图 设置 组 ID 的 操作 肯定 会 返回 失 
败 ， 而 其 他 的 系统 则 无 声息 地 关闭 该 位 ， 但 不 会 对 试图 改变 文件 访问 权 
限 的 操作 直接 做 失败 处 理 。 

FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 增 加 了 另 一 
个 安全 性 功能 以 试图 阻止 误 用 某 些 保护 位 。 如 果 没 有 超级 用 户 权 限 的 进 
程 写 一 个 文件 ， 则 设置 用 户 ID 位 和 设置 组 ID 位 会 被 自动 清除 。 如 果 恶 
意 用 户 找到 一 个 他 们 可 以 写 的 设置 组 ID 和 设置 用 户 ID 文件 ， 即 使 可 以 修 
改 此 文件 ， 他 们 也 没有 对 该 文件 的 特殊 权限 。 





























4.10 iA hy 


S_ISVTX 位 有 一 段 有 趣 的 历史 。 在 UNIX 尚 未 使 用 请 求 分 页 式 技术 
的 早期 版 本 中 ，S_ISVTX 位 被 称 为 粘着 位 (sticky bit) 。 如 果 一 个 可 执 
行程 序 文件 的 这 一 位 被 设置 了 ， 那 么 当 该 程序 第 一 次 被 执行 ， 在 其 终止 
时 ， 程 序 正文 部 分 的 一 个 副本 仍 被 保存 在 交换 区 【程序 的 正文 部 分 是 机 
器 指令 ) 。 这 使 得 下 次 执行 该 程序 时 能 较 快 地 将 其 装载 入 内 存 。 其 原因 
是 : 通常 的 UNIX 文 件 系 统 中 ， 文 件 的 各 数据 块 很 可 能 是 随机 存放 的 ， 
相 比 较 而 言 ， 交 换 区 是 被 作为 一 个 连续 文件 来 处 理 的 。 对 于 通用 的 应 用 
程序 ， 如 文本 编辑 程序 和 C 语 言 编 译 器 ， 我 们 常常 设置 它们 所 在 文件 的 
粘着 位 。 自 然 地 ， 对 于 在 交换 区 中 可 以 同时 存放 的 设置 了 粘着 位 的 文件 
数 是 有 限制 的 ， 以 免 过 多 占用 交换 区 空间 ， 但 无 论 如 何 这 是 一 个 有 用 的 
技术 。 因 为 在 系统 再 次 自 举 前 ， 文 件 的 正文 部 分 总 是 在 交换 区 中 ， 这 正 
是 名 字 中 “粘着 ”的 由 来 。 后 来 的 UNIX 版 本 称 它 为 保存 正文 位 〈saved- 
text bit) ， 因 此 也 就 有 了 常量 $S_ ISVTX。 现 今 较 新 的 UNIX 系 统 大 多 数 
人 


现今 的 系统 扩展 了 粘着 位 的 使 用 范围 ，Single UNIX Specification ù 
许 针对 目录 设置 粘着 位 。 如 果 对 一 个 目录 设置 了 粘着 位 ， 只 有 对 该 目录 
下 列 条 件 之 一 ， 才 能 删除 或 重 命名 该 目录 下 
BAT 

“拥有 此 文件 ; 

“拥有 此 目录 ; 

“是 超级 用 户 。 

目录 /tmp 和 /vavtmp 是 设置 粘着 位 的 典型 候选 者 一 任何 用 户 都 可 在 
这 两 个 目录 中 创建 文件 。 任 一 用 户 〈 用 户 、 组 和 其 他 〉 对 这 两 个 目录 的 
权限 通常 都 是 读 、 写 和 执行 。 但 是 用 户 不 应 能 删除 或 重 命名 属于 其 他 人 
的 文件 ， 为 此 在 这 两 个 目录 的 文件 模式 中 都 设置 了 粘着 位 。 

POSIX.1 没 有 定义 保存 正文 位 ，Single UNIX Specification 将 它 定义 
在 XSI 扩 展 部 分 。FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 
10 则 支持 这 种 功能 。 

在 Solaris 10 中 ， 如 有 果 对 普通 文件 设置 了 粘着 位 ， 那 么 它 就 具有 特殊 
含义 。 在 这 种 情况 下 ， 如 果 任 何 执行 位 都 没有 设置 ， 那 么 操作 系统 就 不 
会 缓存 文件 内 容 。 



































Ichown 








下 面 几 个 chown 函 数 可 用 于 更 改 文 件 的 用 户 ID 和 组 ID。 如 果 两 个 参 
数 owner 或 group 中 的 任意 一 个 是 -1， 则 对 应 的 ID 不 变 。 

#include <unistd.h> 

int chown(const char *pathname, uid_t owner, gid_t group); 

int fchown(int fd, uid_t owner, gid_t group); 

int fchownat(int fd, const char *pathname, uid_t owner, gid_t group, int 
flag); 

int lchown(const char *pathname, uid_t owner, gid_t group); 

4 个 函数 的 返回 值 : 大 成 功 ， 返 回 0; Arnis, e- 

除了 所 引用 的 文件 是 符号 链接 以 外 ， 这 4 个 函数 的 操作 类 似 。 在 符 
号 链接 情况 下 ，lchown 和 fchownat〈 设 置 了 AT_SYMLINK_NOFOLLOW 
ee ee 的 所 有 者 ， 而 不 是 该 符号 链接 所 指向 的 文件 的 

fchown 函 数 改 变 fd 参数 指 网 的 打开 文件 的 所 有 者 ， 既 然 它 在 一 个 已 
打开 的 文件 上 操作 ， 就 不 能 用 于 改变 符号 链接 的 所 有 者 。 

fchownat 函 数 与 chown 或 者 lchown 函 数 在 下 面 两 种 情况 下 是 相同 
的 : 一 种 是 pathname 参 数 为 绝对 路 径 ， 另 一 种 是 fd 参数 取 值 为 
AT_FDCWD 而 pathname 参 数 为 相对 路 径 。 在 这 两 种 情况 下 ， 如 果 flag 参 
数 中 设置 了 AT_SYMLINK_NOFOLLOW 标 志 ，fchownat 与 Ichown 行 为 相 
同 ， 如 果 flag 参 数 中 清除 了 AT_SYMLINK_NOFOLLOW 标 志 ， 则 
fchownat 与 chown 行 为 相同 。 如 果 fd 参 数 设 置 为 打开 目录 的 文件 描述 
符 ， 并 且 pathname 参 数 是 一 个 相对 路 径 名 ，fchownat 函 数 计 算 相 对 于 打 
开 目 录 的 pathname。 

基于 BSD 的 系统 一 直 规 定 只 有 超级 用 户 才 能 更 改 一 个 文件 的 所 有 
者 。 这 样 做 的 原因 是 防止 用 户 改变 其 文件 的 所 有 者 从 而 摆脱 磁盘 空间 限 
他 们 的 限制 。System V 则 人 允许 任 一 用 户 更 改 他 们 所 拥有 的 文件 的 所 

按照 _ POSIX_CHOWN_RESTRICTED 的 值 ，POSIX.1 人 允许 在 这 两 种 
形式 的 操作 中 选用 一 种 。 

对 于 Solaris ”10， 此 功能 是 个 配置 选项 ， 其 默认 值 是 施加 限制 。 而 


FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 则 总 对 chown 施 加 限制 。 

回忆 2.6 节 ，_POSIX_CHOWN_RESTRICTED 和 常量 可 选 地 定义 在 头 
文件 <unistd.h> 中 ， 而 且 总 是 可 以 用 pathconf 或 fpathconf 函 数 进行 查询 。 
此 选项 还 与 所 引用 的 文件 有 关 一 可 在 每 个 文件 系统 基础 上 ， 使 该 选项 起 
作用 或 不 起 作用 。 在 下 文中 ， 如 提 及 “和 若 
_POSIX_CHOWN_RESTRICTED 生 效 >， 则 表示 “这 适用 于 我 们 正在 谈 及 
的 文件 >”， 而 不 管 该 实际 稼 量 是 否 在 头 文件 中 定义 。 

若 POSIX_CHOWN_RESTRICTED 对 指定 的 文件 生效 ， 则 

(1) 只 有 超级 用 户 进 程 能 更 改 该 文件 的 用 户 ID; 

(2) 如 果 进 程 拥有 此 文件 〈 其 有 效用 户 ID 等 于 该 文件 的 用 户 
ID) ， 参 数 owner 等 于 -1 或 文件 的 用 户 ID， 并 且 参 数 group 等 于 进程 的 有 
ee 那么 一 个 非 超 级 用 户 进 程 可 以 更 改 该 文 

组 ID。 

这 意味 着 ， 当 _POSIX_CHOWN_RESTRICTED 有 效 时 ， 不 能 更 改 
其 他 用 户 文件 的 用 户 ID。 你 可 以 更 改 你 所 拥 用 的 文件 的 组 ID， 但 只 能 改 
到 你 所 属 的 组 。 

如 果 这 些 函 数 由 非 超级 用 户 进程 调用 ， 则 在 成 功 返 回 时 ， 该 文件 的 
设置 用 户 ID 位 和 设置 组 ID 位 都 被 清除 。 











4.12 VKE 


stat 结 构成 员 st_size 表 示 以 字 节 为 单位 的 文件 的 长 度 。 此 字段 只 对 普 
通 文件 、 目 录 文 件 和 符号 链接 有 意义 。 

FreeBSD 8.0. Mac OS X 10.6.8 和 Solaris 10 对 管道 也 定义 了 文件 长 
度 ， 它 表示 可 从 该 管道 中 读 到 的 字 市 数 ， 我 们 将 在 15.2 中 讨论 管道 。 

对 于 普通 文件 ， 其 文件 长 度 可 以 是 0， 在 开始 读 这 种 文件 时 ， 将 得 
到 文件 结束 〈end-of-file) 指示 。 对 于 目录 ， 文 件 长 度 通常 是 一 个 数 
《如 16 或 512) 的 整 倍数 ， 我 们 将 在 4.22 节 中 说 明 读 目 录 操 作 。 

对 于 符号 链接 ， 文 件 长 度 是 在 文件 名 中 的 实际 字 节 数 。 例 如 ， 在 下 
面 的 例子 中 ， 文 件 长 度 7 就 是 路 径 名 usrvlib 的 长 度 : 

Irwxrwxrwx 1 root 7 Sep 25 07:14 lib -> usr/lib 

(注意 ， 因 为 符号 链接 文件 长 度 总 是 由 st_size 指 示 ， 所 以 它 并 不 包 
含 通常 C 语 言 用 作 名 字 结 尾 的 null 字 节 。) 

现今 ， 大 多 数 现 代 的 UNIX 系 统 提供 字段 st_blksize 和 st_blocks。 其 
中 ， 第 一 个 是 对 文件 MO 较 合 适 的 块 长 度 ， 第 二 个 是 所 分 配 的 实际 512 字 
节 块 块 数 。 回 忆 3.9 节 ， 其 中 提 到 了 当 我 们 将 st_blksize 用 于 读 操 作 时 ， 
该 一 个 文件 所 需 的 时 间 量 最 少 。 为 了 提高 效率 ， 标 准 IO 库 〈 我 们 将 在 
第 5 章 中 说 明 ) 也 试图 一 次 读 、 写 st_blksize 个 字 节 。 

应 当 了 解 的 是 ， 不 同 的 UNIX 版 本 其 st_blocks 所 用 的 单位 可 能 不 是 
512 字 节 的 块 。 使 用 此 值 并 不 是 可 移植 的 。 

文件 中 的 空洞 

在 3.6 节 中 ， 我 们 提 及 普通 文件 可 以 包含 空洞 。 在 图 3-2 程序 中 例 示 
了 这 一 点 。 衬 洞 是 由 所 设置 的 偏 移 量 超过 文件 尾 端 ， 并 写 入 了 某 些 数据 
后 造成 的 。 作 为 一 个 例子 ， 考 虑 下 列 情 况 : 

$ ls -l core 

-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 

$ du -s core 

272 core 

文件 core 的 长 度 稍稍 超过 8 MB， 可 是 du 命令 报告 该 文件 所 使 用 的 磁 
盘 空 间 总 量 是 272 个 512 字 节 块 〈 即 139 ”264 字 节 ) 。 很 明显 ， 此 文件 中 
有 很 多 空洞 。 

在 很 多 BSD 类 系统 上 ，du 命 令 报 告 的 是 1 024 字 节 块 的 块 数 ，Solaris 
报告 的 是 512 字 节 块 的 块 数 。 在 Linux 上 ， 报 告 的 块 数 单位 取决 于 是 否 设 

















置 了 环境 变量 POSIXLY_CORRECT。 当 设置 了 该 环境 变量 ，du 命令 报 
告 的 是 1024 字 节 块 的 块 数 ， 没 有 设置 该 环境 变量 时 ，du 命令 报告 的 是 
512 字 节 块 的 块 数 。 

正如 我 们 在 3.6 节 中 提 及 的 ， 对 于 没有 写 过 的 字 节 位 置 ，read 函 数 读 
到 的 字 节 是 0。 如 果 执 行 下 面 的 命令 ， 可 以 看 出 正常 的 IO 操 作 读 整个 文 
件 长 度 : 

$ wc -c core 

8483248 core 

带 -c 选 项 的 wc(1) 命 令 计 算 文 件 中 的 字符 数 〈( 字 节 ) 。 

如 果 使 用 实用 程序 (如 cat(1)〉 复制 这 个 文件 ， 那 么 所 有 这 些 空 洞 
都 会 被 填 满 ， 其 中 所 有 实际 数据 字 节 皆 填 写 为 0。 

$ cat core > core.cOpy 

$ Is -l core* 

-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 

-rw-rw-r-- 1 sar 8483248 Nov 18 12:27 core.copy 

$ du -s core* 

272 core 

16592 core.copy 

从 中 可 见 ， 新 文件 所 用 的 实际 字 节 数 是 8 495 104 (512x16 592) 。 
此 长 上 度 与 1s 命 令 报告 的 长 度 不 同 ， 其 原因 是 ， 文 件 系统 使 用 了 若干 块 以 
存放 指 同 实 际 数据 块 的 各 个 指针 。 

有 兴趣 的 读者 可 以 参阅 Bach[1986] 的 4.2 节 、McKusick ”等 [1996] 的 
7.2 节 和 7.3 节 (或 McKusick 和 Neville-Neil[2005] 的 8.2 节 和 8.3 节 》、 
McDougal 和 Mauro[2007] 的 15.2 节 以 及 Singh[2006] 的 第 12 章 ， 以 更 详细 
地 了 解 文件 的 物理 结构 。 











4.13 AFER T 


有 时 我 们 需要 在 文件 尾 端 处 截 去 一 些 数据 以 缩短 文件 。 将 一 个 文件 
的 长 度 截 断 为 0 是 一 个 特例 ， 在 打开 文件 时 使 用 O_TRUNC 标志 可 以 做 
到 这 一 点 。 为 了 截断 文件 可 以 调用 函数 truncate 和 ftruncate。 

#include <unistd.h> 

int truncate(const char *pathname, off_t length); 

int ftruncate(int fd, off_t length); 

两 个 函数 的 返回 值 : ARJ, eo; Aht, el- 

这 两 个 函数 将 一 个 现 有 文件 长 度 截 断 为 length。 如 果 该 文件 以 前 的 
长 度 大 于 length， 则 超过 length 以 外 的 数据 惑 不 再 能 访问 。 如 果 以 前 的 
长 度 小 于 length， 文 件 长 度 将 增加 ， 在 以 前 的 文件 尾 端 和 新 的 文件 尾 端 
之 间 的 数据 将 读 作 0〈 也 就 是 可 能 在 文件 中 创建 了 一 个 空洞 ) 。 

早 于 4.4BSD 的 BSD 系 统 只 能 用 truncate 函 数 截 短 一 个 文件 ， 不 能 用 
它 扩展 一 个 文件 。 

Solaris 对 fcntl 函 数 进行 了 扩展 ， 增 加 了 F_FREESP， 它 允许 释放 一 
个 文件 中 的 任何 一 部 分 ， 而 不 只 是 文件 尾 端 处 的 一 部 分 。 

图 13-6 的 程序 使 用 了 ftruncate 函 数 ， 以 便 在 获得 对 一 个 文件 的 锁 
后 ， 清 空 该 文件 。 








4.14 文件 系统 


为 了 说 明文 件 链 接 的 概念 ， 先 要 介绍 UNIX 文 件 系 统 的 基本 结构 。 
同时 ， 了 人 解 i 节 点 和 指向 i 节点 的 目录 项 之 间 的 区 别 也 是 很 有 益 的 。 

目前 ， 正 在 使 用 的 UNIX 文 件 系 统 有 多 种 实现 。 例 如 ，Solaris 支 持 
多 种 不 同类 型 的 磁盘 文件 系统 : 传统 的 基于 BSD 的 UNIX 文 件 系 统称 
HUFS) ， 读 、 写 DOS 格 式 软盘 的 文件 系统 〈 称 为 PCFS) ， 以 及 读 CD 
的 文件 系统 〈 称 为 HSFS) 。 在 ”图 2-20 中 ， 我 们 已 经 看 到 了 不 同类 型 文 
件 系 统 的 一 个 区 别 。UFS 是 以 Berkeley 快 速 文 件 系 统 为 基础 的 。 本 节 讨 
论 该 文件 系统 。 

每 一 种 文件 系统 类 型 都 有 它 各 自 的 特征 ， 有 些 特征 可 能 是 混淆 不 清 
的 。 例 如 ， 大 部 分 UNIX 文 件 系 统 支持 大 小 写 敏感 的 文件 名 。 因 此 ， 如 
果 创 建 了 一 个 名 为 file.txt 的 文件 以 及 另外 一 个 名 为 fle.TXT 的 文件 ， 束 是 
创建 了 两 个 不 同 的 文件 。 在 Mac OS X 上 ，HFS 文 件 系统 是 大 小 写 保 留 
的 ， 并 且 是 大 小 写 不 敏感 比较 的 。 因 此 ， 如 果 创 建 了 一 个 名 为 他 e.txt 的 
文件 ， 当 你 再 创建 名 为 fle.TXT 的 文件 时 ， 就 会 覆盖 原来 的 fie.txt 文 件 。 
但 是 ， 保 存在 文件 系统 中 的 是 文件 创建 时 的 文件 名 〔( 即 人 je.txt， 因 为 是 
大 小 写 保留 的 ) 。 事 实 上 ， 在 “f, ji, le, ., t x, ”这 个 序列 中 的 大 写 或 小 写 
字母 的 排列 都 会 在 搜索 这 个 文件 时 得 到 匹配 (大 小 写 不 敏感 比较 ) 。 
此 ， 除 了 他 e.txt 和 人 ie.TXT， 我 们 还 可 以 用 File.txt、fILE.tXt 以 及 
FiLe.TxT 等 名 字 来 访问 该 文件 。 

我 们 可 以 把 一 个 磁盘 分 成 一 个 或 多 个 分 区 。 每 个 分 区 可 以 包含 一 个 
文件 系统 SUR 4-13) 。i 节 点 是 固定 长 度 的 记录 项 ， 它 包含 有 关 文 件 
的 大 部 分 信息 。 
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图 4-13 磁盘 、 分 区 和 文件 系统 
如 果 更 仔细 地 观察 一 个 柱 面 组 的 i 节点 和 数据 块 部 分 ， 则 可 以 看 到 
图 4-14 中 所 示 的 情况 。 注 意图 4-14 中 的 下 列 各 点 。 





“在 图 中 有 两 个 目录 项 指 癌 同 一 个 i 节点 。 每 个 i 节点 中 都 有 一 个 链接 
计数 ， 其 值 是 指 癌 该 i 节 点 的 目录 项 数 。 只 有 当 链 接 计 数 减 少 至 0 时 ， 才 
可 删除 该 文件 〈 也 就 是 可 以 释放 该 文件 占用 的 数据 块 ) 。 这 就 是 为 什 
么 “解除 对 一 个 文件 的 链接 ”操作 并 不 总 是 意味 着 “释放 该 文件 占用 的 磁 
盘 块 > 的 原因 。 这 也 是 为 什么 删除 一 个 目录 项 的 函数 被 称 之 为 ”unlink 而 
不 是 delete 的 原因 。 在 stat 结 构 中 ， 链 接 计 数 包含 在 st_nlink 成 员 中 ， 其 基 
本 系统 数据 类 型 是 nlink_t。 这 种 链接 类 型 称 为 硬 链 接 。 回 忆 2.5.2 节 ， 其 
中 ，POSIX.1 常 量 LINK_MAX 指 定 了 一 个 文件 链接 数 的 最 大 值 。 
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图 4-14 较 详 细 的 柱 面 组 的 i 节点 和 数据 块 
“另外 一 种 链接 类 型 称 为 符号 链接 (symbolic link) 。 符 号 链接 文件 
的 实际 内 容 〈 在 数据 块 中 包含 了 该 符号 链接 所 指向 的 文件 的 名 字 : 在 
下 面 的 例子 中 ， 目 录 项 中 的 文件 名 是 3 个 字符 的 字符 串 lib， 而 在 该 文件 
中 包含 了 7 个 字 节 的 数据 usr/lib: 
Irwxrwxrwx 1 root 7 Sep 25 07:14 lib -> urs/lib 
该 i 节 点 中 的 文件 类 型 是 S_ IFLNK， 于 是 系统 知道 这 是 一 个 符号 


"i 节点 包含 了 文件 有 关 的 所 有 信息 : 文件 类 型 、 文件 访问 权限 位 、 
文件 长 度 和 指向 文件 数据 块 的 指针 等 。stat 结 构 中 的 大 多 数 信 | SABENA 
TA 只 有 两 项 重要 数据 存放 在 目录 项 中 ;文件 名 和 i 节 点 编号 。 其 他 
的 数据 项 《如 文件 名 长 度 和 目录 记录 长 度 ) GFR EAB TTR 
编写 的 数据 类 型 是 ino_t。 

“因为 目录 项 中 的 ji 节点 编号 指 同 同一 文件 系统 中 的 相应 ji 节点， 一 个 
目录 项 不 能 指向 另 一 个 文件 系统 的 节点。 这 就 是 为 什么 In(1) 命 令 ( 构 
造 一 个 指 疝 一 个 现 有 文件 的 新 目录 项 ) 不 能 跨越 文件 系统 的 原因 。 我 们 
将 在 下 一 市 说 明 ]link 函 数 。 

* 当 在 不 更 换文 件 系 统 的 情况 下 为 一 个 文件 重 命 名 时 ， 该 文件 的 实 
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际 内 容 并 未 移动 ， 只 需 构 造 一 个 指 同 现 有 i 节点 的 新 目录 项 ， 并 删除 老 
的 目录 项 。 链 接 计 数 不 会 改变 。 例 如 ， 为 将 文件 /usrlib/foo 重 命名 
为 /usr/foo， 如 果 目 录 /usrNib 和 /usr 在 同一 文件 系统 中 ， 则 文件 foo 的 内 容 
无 需 移动 。 这 就 是 mv(1) 命 令 的 通 第 操作 方式 。 

我 们 说 明了 普通 文件 的 链接 计数 概念 ， 但 是 对 于 目录 文件 的 链接 计 
数字 段 又 如 何 呢 ? 假定 我 们 在 工作 目录 中 构造 了 一 个 新 目录 : 

$mkdir testdir 

图 4-15 显 示 了 其 结果 。 注 意 ， 该 图 显 式 地 显示 了 .和 .. 目 录 项 。 

编写 为 2549 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计数 为 
2。 任 何 一 个 叶 目 录 〔( 不 包含 任何 其 他 目录 的 目录 ) 的 链接 计数 总 是 2， 
数值 2 来 自 于 命名 该 目录 Ctestdir) 的 目录 项 以 及 在 该 目录 中 的 .项 。 编 
写 为 1267 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计 数 大 于 或 等 
于 3。 它 大 于 或 等 于 3 的 原因 是 ， 人 至 少 有 3 个 目录 项 指向 它 : 一 个 是 命名 
它 的 目录 项 〈 在 图 4-15 中 没有 表示 出 来 ) ， 第 二 个 是 在 该 目录 中 的 .项 ， 
第 三 个 是 在 其 子 目录 testdir 中 的 .. 项 。 注 意 ， 在 父 目 录 中 的 每 一 个 子 目 录 
都 使 该 父 目 录 的 链接 计数 增加 1。 
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DEE 
图 4-15 创建 了 目录 testdir 后 的 文件 系统 实例 


这 种 格式 与 UNIX 文 件 系统 的 经 典 格式 类 似 ， 在 Bach[1986] 的 第 4 章 
中 对 此 进行 了 详细 说 明 。 关 于 伯克利 快速 文件 系统 对 此 所 做 的 更 改 请 参 
a] McKusick 等 [1996] 的 第 7 章 以 及 McKusick 和 Neville-Neil[2005] 中 的 
第 8 章 。 关 于 UFS〔 伯 克利 快速 文件 系统 的 Solaris 版 〉 的 详细 情况 ， 请 参 
见 McDougal 和 Mauro[2007] 的 第 15 章 。 关 于 Mac OS X 使 用 的 HFS 文 件 系 
统 格式 ， 请 参阅 Singh[2006] 的 第 12 章 。 
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MEAT, AIS CHa ae TS ARR BE 
一 个 指 问 现 有 文件 的 链接 的 方法 是 使 用 link 函 数 或 linkat 函 数 。 

#include <unistd.h> 

int link(const char *existingpath, const char *newpath); 

int linkat(int efd, const char *existingpath, int nfd, const char *newpath， 
int flag); 

两 个 函数 的 返回 值 ， 厦 成功， 返回 0; 徊 出错， 返回 -1 

这 两 个 函数 创建 一 个 新 目录 项 newpath， 它 引用 现 有 文件 
existingpath。 如 果 newpath 已 经 存在 ， 则 返回 出 错 。 只 创建 newpath 中 的 
最 后 一 个 分 量 ， 路 径 中 的 其 他 部 分 应 当 已 经 存在 。 

对 于 linkat 函 数 ， 现 有 文件 是 通过 efd 和 existingpath 参 数 指 定 的 ， 新 
的 路 径 名 是 通过 nfd 和 newpath 参 数 指定 的 。 默 认 情 况 下 ， 如 果 两 个 路 径 
名 中 的 任 一 个 是 相对 路 径 ， 那 么 它 需要 通过 相对 于 对 应 的 文件 摘 述 符 进 
行 计算 。 如 果 两 个 文件 描述 符 中 的 任 一 个 设置 为 AT_FDCWD， 那 么 相 
应 的 路 径 名 (如 果 它 是 相对 路 人 径 〉 束 通过 相对 于 当前 目录 进行 计算 。 如 
果 任 一 路 径 名 是 绝对 路 径 ， 相 应 的 文件 描述 符 参 数 就 会 被 名 略 。 

当 现 有 文件 是 符号 链接 时 ， 由 flag 参 数 来 控制 linkat 函 数 是 创建 指 问 
现 有 符号 链接 的 链接 还 是 创建 指向 现 有 符号 链接 所 指向 的 文件 的 链接 。 
如 果 在 flag 参 数 中 设置 了 AT_SYMLINK_FOLLOW 标 志 ， 就 创建 指向 符 
号 链接 目标 的 链接 。 如 果 这 个 标志 被 清除 了 ， 则 创建 一 个 指向 符号 链接 
本 身 的 链接 。 

创建 新 目录 项 和 增加 链接 计数 应 当 是 一 个 原子 操作 (请 回忆 在 3.11 
广 中 对 原子 操作 的 讨论 〉。 

里 然 POSIX.1 人 允许 实现 支持 跨越 文件 系统 的 链接 ， 但 是 大 多 数 实现 
要 求 现 有 的 和 新 建 的 两 个 路 径 名 在 同一 个 文件 系统 中 。 如 果实 现 文 持 创 
建 指 回 一 个 目录 的 硬 链接 ， 那 么 也 仅 限 于 超级 用 户 才 可 以 这 样 做 。 其 理 
由 是 这 样 做 可 能 在 文件 系统 中 形成 循环 ， 大 多 数 处 理 文件 系统 的 实用 程 
序 都 不 能 处 理 这 种 情况 〈4.17 ” 节 将 说 明 一 个 由 符号 链接 引入 循环 的 例 
T) 。 因 此 ， 很 多 文件 系统 实现 不 允许 对 于 目录 的 硬 链 接 。 

为 了 删除 一 个 现 有 的 目录 项 ， 可 以 调用 unlink 函 数 。 























#include <unistd.h> 

int unlink(const char *pathname); 

int unlinkat(int fd, const char *pathname, int flag); 

PAS PRACT, allo; 在 出 错 ， 返 回 -1 

这 两 个 函数 删除 目录 项 ， 并 将 由 pathname 所 引用 文件 的 链接 计数 减 
1。 如 果 对 该 文件 还 有 其 他 链接 ， 则 仍 可 通过 其 他 链接 访问 该 文件 的 数 
据 。 如 果 出 错 ， 则 不 对 该 文件 做 任何 更 改 。 

我 们 在 前 面 已 经 提 及 ， 为 了 解除 对 文件 的 链接 ， 必 须 对 包含 该 目录 
项 的 目录 具有 写 和 执行 权限 。 正 如 4.10 节 所 述 ， 如 果 对 该 目录 设置 了 粘 
着 位 ， 则 对 该 目录 必须 具有 号 权限 ， 并 且 有 具备 下 面 三 个 条 件 之 一 : 

。 拥 有 该 文件 ; 

“拥有 该 HK; 

"具有 超级 用 户 权 限 。 

只 有 当 链 接 计 数 达 到 0 时 ， 该 文件 的 内 容 才 可 被 删除 。 另 一 个 条 件 
也 会 阻止 删除 文件 的 内 容 一 只 要 有 进程 打开 了 该 文件 ， 其 内 容 也 不 能 删 
除 。 关 闭 一 个 文件 时 ， 内 核 首 先 检查 打开 该 文件 的 进程 个 数 ， 如 果 这 个 
Me 
文件 的 内 容 。 

如 果 pathname 参 数 是 相对 路 径 名 ， 那 么 unlinkat 函 数 计 算 相 对 于 由 fd 
文件 描述 符 参 数 代表 的 目录 的 路 径 名 。 如 果 fd 参 数 设 置 为 
AT_ FDCWD， 那 么 通过 相对 于 调用 进程 的 当前 工作 目录 来 计算 路 径 
名 。 如 果 pathname 参 数 是 绝对 路 径 名 ， 那 么 fd 参数 被 忽略 。 

flag 参 数 给 出 了 一 种 方法 ， 使 调用 进程 可 以 改变 unlinkat 函 数 的 默认 
行为 。 当 AT_REMOVEDIR 标 志 被 设置 时 ，unlinkat 函数 可 以 类 似 于 
rmdir 一 样 删除 目录 。 如 果 这 个 标志 被 清除 ， unlinkat 与 unlink 执 行 同 样 
的 操作 。 

实例 

图 4-16 的 程序 打开 一 个 文件 ， 然 后 解除 它 的 链接 。 执 行 该 程序 的 进 
程 然 后 睡 虑 15 秒 ， 接 着 就 终止 。 














finclude "apue 
tinclude “fcnt1,h> 


int 
main (vo1d) 
| 
1f (open("tempfile", O_RDWR) < 0) 
err_sys("open error"); 
if (unlink("tempfile") < 0) 
err_sys("unlink error"); 
printf ("file unlinked\n") ; 





sleep (15); 
printf ("done\n") ; 
exit (0); 


图 4-16 打开 一 个 文件 ， 然 后 unlink 它 
运行 该 程序 ， 其 结果 是 : 


$ Is -l tempfile 查看 文件 大 小 
-IW-I----- 1 sar 413265408 Jan 21 07:14 tempfile 
$ df /home 检查 可 用 磁盘 空间 


Filesystem 1K-blocks Used Available Use% Mounted on/dev/hda4 
11021440 1956332 9065108 18% /home 


$ /a.out & 在 后 台 运 行 图 4-16 程 序 
1364 shell 打 印 其 进程 ID 
$ file unlinked 解除 文件 链接 

ls -l tempfile 观察 文件 是 否 仍然 存在 


ls: tempfile: No such file or directory 目录 项 已 删除 
$ df /home 检查 可 用 磁盘 空间 有 无 变化 








Filesystem 1K-blocks Used Available Use% Mounted on/dev/hda4 
11021440 1956332 9065108 18% /home 





he done 程序 执行 结束 ， 关 闭 所 有 打开 
X 
df /home 现在 ， 应 当 有 更 多 可 用 磁盘 空 


间 

Filesystem 1K-blocks Used Available Use% Mounted on 

/dev/hda4 11021440 1552352 9469088 15% /home 

现在 ，394.1 MB 磁盘 空间 可 用 

unlink 的 这 种 特性 经 常 被 程序 用 来 确保 即使 是 在 程序 骨 沉 时 ， 它 所 
创建 的 临时 文件 也 不 会 遗留 下 来 。 进 程 用 open 或 creat 创 建 一 个 文件 ， 然 
后 立即 调用 unlink， 因 为 该 文件 仍旧 是 打开 的 ， 所 以 不 会 将 其 内 容 删 
除 。 只 有 当 进 程 关 闭 该 文件 或 终止 时 在 这 种 情况 下 ， 内 核 关 闭 该 进程 
所 打开 的 全 部 文件 ) ， 该 文件 的 内 容 才 被 删除 。 

如 果 pathname 是 符号 链接 ， 那 么 unlink 删 除 该 符号 链接 ， 而 不 是 删 
除 由 该 链接 所 引用 的 文件 。 给 出 符号 链接 名 的 情况 下 ， 没 有 一 个 函数 能 
删除 由 该 链接 所 引用 的 文件 。 

如 果 文 件 系统 文 持 的 话 ， 超 级 用 户 可 以 调用 unlink， 其 参数 
pathname 指 定 一 个 目录 ， 但 是 通 稼 应 当 使 用 rmdir 函 数 ， 而 不 使 用 unlink 
这 种 方式 。 我 们 将 在 4.21 节 中 说 明 rmdir 函 数 。 

我 们 也 可 以 用 remove 函数 解除 对 一 个 文件 或 目录 的 链接 。 对 于 文 
件 ，remove ”的 功能 与 unlink 相 同 。 对 于 目录 ，remove 的 功能 与 rmdir 相 


同 。 








#include <stdio.h> 
int remove(const char *pathname); 
返回 值 : ERJ, RE 大 出 错 ， 返 回 -1 
ISO C 指 定 remove 函 数 删 除 一 个 文件 ， 这 更 改 了 UNIX 历 来 使 用 的 名 
oon 其 原因 是 实现 C 标 准 的 大 多 数 非 UNIX 系 统 并 不 文 持 文 件 链 





4.16 pki #{rename#l!renameat 


LIFE H oe By VL Fd rename ek 22K 7 renameat K Bit 77 FE Ait « 

#include <stdio.h> 

int rename(const char *oldname, const char *newname); 

int renameat(int oldfd, const char *oldname, int newfd, const char 
*newname); 

两 个 函数 的 返回 值 : 知 成 功 ， 返 回 0; 知 出 错 ， 返 回 -1 

ISO C 对 文件 定义 了 rename 函 数 〈C 标 准 不 处 理 目录 ) 。POSIX.1 扩 
展 此 定义 ， 使 其 包含 了 目录 和 符号 链接 。 

根据 oldname 是 指 文件 、 目 录 还 是 符号 链接 ， 有 几 种 情况 需要 加 以 
说 明 。 我 们 也 必须 说 明 如 果 newname 已 经 存在 时 将 会 发 生 什 么 。 

(1) 如 果 oldname 指 的 是 一 个 文件 而 不 是 目录 ， 那 么 为 该 文件 或 符 
号 链接 重 命 名 。 在 这 种 情况 下 ， 如 果 newname 已 存在 ， 则 它 不 能 引用 一 
个 目录 。 如 果 newname 已 存在 ， 而 且 不 是 一 个 目录 ， 则 先 将 该 目录 项 删 
除 然后 将 oldname 重 命 名 为 newname。 对 包含 oldname 的 目录 以 及 包含 
newname 的 目录 ， 调 用 进程 必须 具有 写 权 限 ， 因 为 将 更 改 这 两 个 目录 。 
(2) 如 知 oldname 指 的 是 一 个 目录 ， 那 么 为 该 目录 重 命 名 。 如 果 
newname 已 存在 ， 则 它 必 须 引 用 一 个 目录 ， 而 且 该 目录 应 当 是 空 目 录 
《 空 目 录 指 的 是 该 目录 中 只 有 .和 .. 项 ) o WR newname 存 在 〈 而 且 是 一 
SAS) ， 则 先 将 其 删除 ， 然 后 将 oldname 重 命名 为 newname。 74 
外 ， 当 为 一 个 目录 重 命名 时 ，newname 不 能 包含 oldname 作 为 其 路 径 前 
缀 。 例 如 ， 不 能 将 /usrfoo 重 命名 为 /usrfoo/testdir， 因 为 旧名 字 
(/usr/foo) 是 新 名 字 的 路 人 径 前 级 ， 因 而 不 能 将 其 删除 。 
(3) 如 奇 oldname 或 hewname 引 用 符号 链接 ， 则 处 理 的 是 符号 链接 
本 身 ， 而 不 是 它 所 引用 的 文件 。 
(4) 不 能 对 .和 .. 重 命名 。 更 确切 地 说 ，. 和 .. 都 不 能 出 现在 oldname 
和 newname 的 最 后 部 分 。 
(5) 作为 一 个 特例 ， 如 果 oldname 和 newname3 引 用 同一 文件 ， 则 函 
数 不 做 任何 更 改 而 成 功 返 回 。 

如 各 newname 已 经 存在 ， 则 调用 进程 对 它 需 要 有 写 权 限 〈 如 同 删除 
情况 一 样 ) 。 另 外 ， 调 用 进程 将 删除 oldname 目 录 项 ， 并 可 能 要 创建 
newname 目 录 项 ， 所 以 它 需 要 对 包含 oldname 及 包含 newname 的 目录 具有 
写 和 执行 权限 。 















































除了 当 oldname 或 hewname 指 向 相对 路 径 名 时 ， 其 他 情况 下 renameat 
函数 与 rename 函 数 功能 相同 。 如 果 oldname 参 数 指定 了 相对 路 径 ， 就 相 
对 于 oldfd 参 数 引 用 的 目录 来 计算 oldname。 类 似 地 ， 如 果 newname 指 定 
了 相对 路 径 ， 就 相对 于 newfd 引 用 的 目录 来 计算 newname。oldfd 或 newfd 
参数 (或 两 者 ) 都 能 设置 成 AT_FDCWD， 此 时 相对 于 当前 目录 来 计算 
相应 的 路 径 名 。 


4.17 人 符号 链接 


符号 链接 是 对 一 个 文件 的 间接 指针 ， 它 与 上 一 节 所 述 的 便 链 接 有 所 
不 同 ， 便 链接 直接 指 同 文件 的 节点。 引入 符号 链接 的 原因 是 为 了 避 开 
便 链接 的 一 些 限制 。 

“ 便 链 接 通 常 要 求 链 接 和 文件 位 于 同一 文件 系统 中 。 

a AHA PO Be ETE el Ae Ee CHE JER EARS FE 
情况 下 ) 。 

对 符号 链接 以 及 它 指 同 何 种 对 象 并 无 任何 文件 系统 限制 ， 任 何 用 户 
都 可 以 创建 指 问 目录 的 符号 链接 。 符 号 链接 一 般 用 于 将 一 个 文件 或 整个 
目录 结构 移 到 系统 中 另 一 个 位 置 。 

当 使 用 以 名 字 引 用 文件 的 函数 时 ， 应 当 了 解 该 函数 是 否 处 理 符 号 链 
接 。 也 就 是 该 函数 是 否 跟随 符号 链接 到 达 它 所 链接 的 文件 。 如 知 该 函数 
具有 处 理 符 号 链接 的 功能 ， 则 其 路 径 名 参数 引用 由 符号 链接 指 同 的 文 
件 。 否 则 ， 一 个 路 径 名 参数 引用 链接 本 喘 ， 而 不 是 由 该 链接 指 癌 的 文 
件 。 图 4-17 列 出 了 本 章 中 所 说 明 的 各 个 函数 是 否 处 理 符 号 链接 。 在 图 4- 
17 中 没有 列 出 mkdir、mkinfo、mknod 和 rmdir 这 些 函 数 ， 其 原因 是 ， 当 
路 径 名 是 符号 链接 时 ， 它 们 都 出 错 返回 。 以 文件 描述 符 作 为 参数 的 一 些 
函数 《如 fstat、fchmod 等 ) 也 未 在 该 图 中 列 出 ， 其 原因 是 ， 对 符号 链接 
的 处 理 是 由 返回 文件 描述 符 的 函数 (通常 是 open) 进行 的 。chown 是 否 
ee fEPPA RRA ABH, chownek Aah eR a 
Fy TE Fo 

符号 链接 由 4.2BSD 引 入 ，chown 最 初 并 不 跟随 符号 链接 ， 但 在 
4.4BSD 中 情况 发 生 了 变化 。SVR4 中 的 System V 包 含 了 对 符号 链接 的 支 
持 ， 但 与 原始 BSD 中 的 行为 已 大 不 相同 ， 也 实现 了 chown 函 数 跟随 符号 
链接 。 早 期 Linux 版 本 中 (Linux 2.1.81 以 前 的 版 本 ) ，chown 并 不 跟随 符 
号 链接 。 从 2.1.81 版 开始 ，chown 跟 随 符号 链接 。FreeBSD 8.0、Mac OS 
X 10.6.8 和 Solaris 10 中 ， chown 跟 随 符 写 链接 。 所 有 这 些 平台 都 实现 了 
lchown， 它 改变 符号 链接 自身 的 所 有 权 。 























不 跟随 符号 链接 | 跟随 符号 链接 


access 
chdir 
chmod 
chown 
creat 
exec 
lchown 
link 
lstat 
open 
opendir 
pathconf 
readlink 
remove 
rename 
stat 
truncate 
unlink 


图 4-17 各 个 函数 对 符号 链接 的 处 理 
图 4-17 的 一 个 例外 是 ， 同 时 用 O_CREAT 和 O_EXCL 两 者 调用 open 函 
数 。 在 此 情况 下 ， 大 路 径 名 引用 符号 链接 ，open 将 出 错 返 回 ，errno 设 置 








为 EEXIST。 这 种 处 理 方 式 的 意图 是 堵塞 一 个 安全 性 漏洞 ， 以 防止 具有 
A eee 

SEB 

AEA ES BEE A BEE SCE RSH S| AVE. KERR ES WY A 
2 errno 值 为 ELOOP。 考 虑 下 列 命 令 
FYI: 

$ mkdir foo 创建 一 个 新 目录 





$ touch foo/a 创建 一 个 0 长 度 的 文件 
$ In -s ../foo foo/testdir 创建 一 个 符号 链接 


-TW-T----- 1 Sar 0 Jan 22 00:16 a 

lrwxrwxrwx 1 sar 6 Jan 22 00:16 testdir -> ../foo 
$ ls -l foo 

total 0 


这 创建 了 一 个 目录 foo， 它 包含 了 一 个 名 为 a 的 文件 以 及 一 个 指 网 foo 
的 符号 链接 。 在 图 4-18 中 显示 了 这 种 结果 ， 图 中 以 圆 表示 目录 ， 以 正方 
形 表示 一 个 文件 。 


p. i N 


foo ~ 


nN ` 


testdir) 
i E it 


图 4-18 构成 循环 的 符号 链接 testdir 

如 果 我 们 写 一 段 简单 的 程序 ， 使 用 Solaris 的 标准 函数 ftw(3) 以 降序 
通 历 文件 结构 ， 打 印 每 个 遇 到 的 路 径 名 ， 则 其 输出 是 : 

foo 

foo/a 

foo/testdir 

foo/testdir/a 

foo/testdir/testdir 

foo/testdir/testdir/a 

foo/testdir/testdir/testdir 

foo/testdir/testdir/testdir/a 

(更 多 行 ， 直 至 ftw 出 错 返 回 ， 此 时 ，errno 值 为 ELOOP) 

4.22 节 提供 了 我 们 自己 的 ftw 函 数 版 本 ， 它 用 lstat 代 蔡 stat 以 阻止 它 跟 
随 符号 链接 。 

注意 ，Linux 的 ftw 和 nftw 函 数 记 录 了 所 有 看 到 的 目录 并 避免 多 次 重 
复 处 理 一 个 目录 ， 因 此 这 两 个 函数 不 显示 这 种 程序 运行 行为 。 

这 样 一 个 循环 是 很 容易 消除 的 。 因 为 unlink 并 不 跟随 符号 链接 ， 所 








以 可 以 unlink 文件 foo/testdir。 但 是 如 果 创 建 了 一 个 构成 这 种 循环 的 硬 链 
接 ， 那 么 就 很 难 消除 它 。 这 就 是 为 什么 link 函 数 不 允 许 构 造 指 同 目 录 的 
人 硬 链接 的 原因 (除非 进程 具有 超级 用 户 权 限 〉。 

实际 上 ，Rich ”Stevens 在 写本 节 的 最 初版 本 时 ， 在 自己 的 系统 上 做 
了 一 个 这 样 的 实验 。 结 果 文 件 系 统 变 得 错误 百出 。 正 常 的 fsck(1) 实 用 程 
序 不 能 修复 问题 。 为 了 修复 文件 系统 ， 不 得 不 使 用 了 并 不 推荐 使 用 的 工 
具 clri(8) 和 dcheck(8)。 

对 目录 的 硬 链 接 的 需求 由 来 已 入， 但 是 使 用 符号 链接 和 mkdir 函 
数 ， 用 户 就 不 再 需要 创建 指 同 目 录 的 便 链接 了 。 

用 open 打 开 文 件 时 ， 如 果 传 递 给 open 函 数 的 路 径 名 指定 了 一 个 符号 
链接 ， 那 么 open 跟 随 此 链接 到 达 所 指定 的 文件 。 寿 此 符号 链接 所 指 问 的 
文件 并 不 存在 ， 则 open 返 回 出 错 ， 表 示 它 不 能 打开 该 文件 。 这 可 能 会 使 
不 熟悉 符号 链接 的 用 户 感 到 迷惑 ， 例 如 : 











$ In -s /no/such/file myfile 创建 一 个 符号 链接 

myfile ls 查 到 该 文件 

$ cat myfile 试图 查看 该 文件 

$ ls myfile 

cat: myfile: No such file or directory 

$ Is -1 myfile 答 试 -] 选 项 

Irwxrwxrwx 1 sar 13 Jan 22 00:26 myfile -> /no/such/file 


文件 myfile 存 在 ， 但 cat 却 称 没有 这 一 文件 。 其 原因 是 myfile 是 个 符 
写 链 接 ， 由 该 符 写 链接 所 指 癌 的 文件 并 不 存在 。]s 命 令 的 -1 选项 给 我 们 
两 个 提示 : 第 一 个 字符 是 |， 它 表示 这 是 一 个 符 写 链 接 ， 而 -> 也 表明 这 是 
一 个 符号 链接 。1s 命令 还 有 男 一 个 选项 -Ff， 它 会 在 符 写 链接 的 文件 名 后 
加 一 个 @ 符 写 ， 在 未 使 用 -l 选 项 时 ， 这 可 以 帮助 我 们 识别 出 符号 链接 。 








4.18 fi! All sc AY RES Be 


可 以 用 symlink 或 symlinkat 函 数 创建 一 个 符号 链接 。 

#include <unistd.h> 

int symlink(const char *actualpath, const char *sympath); 

int symlinkat(const char *actualpath, int fd, const char *sympath); 

两 个 函数 的 返回 值 : 徊 成 功 ， 返 回 0; 大 出 错 ， 返 回 -1 

函数 创建 了 一 个 指 回 actualpath 的 新 目录 项 sympath。 在 创建 此 符号 
链接 时 ， 并 不 要 求 actualpath 已 经 存在 〈 在 上 一 节 结 束 部 分 的 例子 中 我 们 
已 经 看 到 了 这 一 点 ) 。 并 且 ，actualpath 和 sympath 并 不 需要 位 于 同一 文 
件 系统 中 。 

symlinkat 函 数 与 Symlink 函 数 类 似 ， 但 sympath 参 数 根 据 相 对 于 打开 
文件 描述 符 引 用 的 目录 CH fd 参数 指定 ) 进行 计算 。 如 果 sympath 参 
数 指定 的 是 绝对 路 径 或 者 fd 参数 设置 了 AT_FDCWD 值 ， 那 么 symlinkat 
就 等 同 于 symlink 函 数 。 

因为 open 函 数 跟随 符 写 链 接 ， 所 以 需要 有 一 种 方法 打开 该 链接 本 
身 ， 并 读 该 链接 中 的 名 字 。readlink 和 readlinkat 逊 数 提供 了 这 种 功能 。 
#include <unistd.h> 
ssize_t readlink(const char *restrict pathname, char *restrict buf, 

size_t bufsize); 
ssize_t readlinkat(int fd, const char* restrict pathname, 

char *restrict buf, size_t bufsize); 

两 个 函数 的 返回 值 : 大 成 功 ， 返 回 读 取 的 字 节 数 ; Aa, el- 
两 个 函数 组 合 了 open. read 和 close 的 所 有 操作 。 如 果 函 数 成 功 执 
行 ， 则 返回 读 入 buf 的 字 节 数 。 在 buf 中 返回 的 符号 链接 的 内 容 不 以 null 
字 节 终止 。 

当 pathname 参 数 指定 的 是 绝对 路 径 名 或 者 fd 参数 的 值 为 
AT_ FDCWD，readlinkat 函 数 的 行为 与 readlink 相 同 。 但 是 ， 如 果 人 fd 参数 
是 一 个 打开 目录 的 有 效 文 件 摘 述 符 并 且 pathname 参 数 是 相对 路 径 名 ， 则 
readlinkat 计 算 相 对 于 由 fd 代表 的 打开 目录 的 路 径 名 。 








-> 


4.19 5 TERY TH 


在 4.2 节 中 ， 我 们 讨论 了 Single UNIX Specification 2008 年 版 如 何 提 
高 stat 结 构 中 时 间 字 段 的 精度 ， 从 原来 的 秒 提高 到 秒 加 上 纳 秒 。 每 个 文 
件 属 性 所 保存 的 实际 精度 依赖 于 文件 系统 的 实现 。 对 于 把 时 间 惟 记录 在 
秒 级 的 文件 系统 来 说 ， 纳 秒 这 个 字段 就 会 被 填充 为 0。 对 于 时 间 惟 的 记 
录 精 度 高 于 秒 级 的 文件 系统 来 说 ， 不 足 秒 的 值 被 转 换 成 纳 秒 并 记录 在 纳 
秒 这 个 字段 中 。 

对 每 个 文件 维护 3 个 时 间 字 段 ， 它 们 的 意义 示 于 图 4-19 中 。 


st atim 文件 数据 的 最 后 访问 时 间 read 


st mtim 文件 数据 的 最 后 修改 时 间 write 
st_ctim i 节点 状态 的 最 后 更 改 时 间 chmod, chown 


图 4-19 与 每 个 文件 相关 的 3 个 时 间 值 

注意 ， 修 改 时 间 Cst_mtim) 和 状态 更 改 时 间 Cst_ctim) 之 间 的 区 
别 。 修 改 时 间 是 文件 内 容 最 后 一 次 被 修改 的 时 间 。 状 态 更 改 时 间 是 该 文 
件 的 i 节 点 最 后 一 次 被 修改 的 时 间 。 在 本 章 中 我 们 已 说 明了 很 多 影响 到 ji 
节点 的 操作 ， 如 更 改 文 件 的 访问 权限 、 更 改 用 户 ID、 更 改 链接 数 等 ， 但 
它们 并 没有 更 改 文 件 的 实际 内 容 。 因 为 i 节点 中 的 所 有 信息 都 是 与 文件 
的 实际 内 容 分 开 存 放 的 ， 所 以 ， 除 了 要 记录 文件 数据 修改 时 间 以 外 ， 还 
需要 记录 状态 更 改 时间 ， 也 就 是 更 改 i 节点 中 信息 的 时 间 。 

注意 ， 系 统 并 不 维护 对 一 个 i 节点 的 最 后 一 次 访问 时 间 ， 所 以 access 
和 stat 函 数 并 不 更 改 这 3 个 时 间 中 的 任 一 个 。 

系统 省 理 员 第 第 使 用 访问 时 间 来 删除 在 一 定时 间 范 围 内 没有 被 访问 
过 的 文件 。 典 型 的 例子 是 删除 在 过 去 一 周 内 没有 被 访问 过 的 名 为 aout 或 
core 的 文件 。find(1) 命 令 第 被 用 来 进行 这 种 类 型 的 操作 。 

修改 时 间 和 状态 更 改 时 间 可 被 用 来 归档 那些 内 容 已 经 被 修改 或 i 记 
ROAR EAC. 

ls 命令 按 这 3 个 时 间 值 中 的 一 个 排序 进行 显示 。 系 统 默 认 用 -或 -t 
选项 调用 时 ) 是 按 文 件 的 修改 时 间 的 先后 排序 显示 。-u 选 项 使 ls 命令 按 



































访问 时 间 排 序 ，-c 选 项 则 使 其 按 状 态 更 改 时 间 排 序 。 

图 4-20 列 出 了 我 们 已 说 明 过 的 各 种 函数 对 这 3 个 时 间 的 作用 。 回 忆 
4.14 节 中 所 述 ， 目 录 是 包含 目录 项 (文件 名 和 相关 的 i 节点 编号 〉 的 文 
件 ， 增 加 、 删 除 或 修改 目录 项 会 影响 到 它 所 在 目录 相关 的 3 个 时 间 。 这 
就 是 在 图 4-20 中 包含 两 列 的 原因 ， 其 中 一 列 是 与 该 文件 〈 或 目录 ) 相关 
的 3 个 时 间 ， 男 一列 是 与 所 引用 的 文件 (或 目录 ) 的 父 目 录 相 关 的 3 个 时 
间 。 例 如 ， 创 建 一 个 新 文件 影响 到 包含 此 新 文件 的 目录 ， 也 影响 该 新 文 


件 的 i 季 点 。 但 是 ， 读 或 写 一 个 文件 只 影响 该 文件 的 i 节操， 而 对 目录 则 
无 影响 。 








所 引用 文件 或 目录 


引用 的 文件 或 目录 HREF 


chmod, fchmod 
chown, fchown 
creat 

creat 

exec 

lchown 

link 

mkdir 

mkfifo 

open 

open 

pipe 

read 

remove 

remove 

rename 

rmdir 
truncate, ftruncate 
unlink 


utimes, utimensat, 
futimens 
write 


0. CREAT 新 文件 
0 TRUNC 现 有 文件 


第 二 个 参数 的 父 四 录 


0 CREAT 新 文件 
0 TRUNC 现 有 文件 


删除 文件 = unlink 
删除 目录 = rmdir 
对 于 两 个 参数 




















图 4-20 各 种 函数 对 访问 、 修 改 和 状态 更 改 时 间 的 作用 

Cmkdir 和 rmdir 函 数 将 在 4.21 节 中 说 明 。utimes、utimensat、 
futimens 函 数 将 在 下 一 节 中 说 明 。7 个 exec 函 数 将 在 8.10 节 中 讨论 。 第 15 
章 将 说 明 mkfifo 和 pipe 函 数 。 ) 





4.20 pki 2 futimens. utimensat#llutimes 


一 个 文件 的 访问 和 修改 时 间 可 以 用 以 下 几 个 函数 更 改 。futimens 和 
utimensat 国 数 可 以 指定 纳 秒 级 精度 的 时 间 戳 。 用 到 的 数据 结构 是 与 stat 
函数 族 相同 的 timespec 结 构 〈 见 4.2 节 ) 。 

#include <sys/stat.h> 

int futimens(int fd, const struct timespec times[2]); 

int utimensat(int fd, const char *path, const struct timespec times[2], int 


flag); 
两 个 函数 返回 值 : ERJ, Belo; AE, e- 

这 两 个 函数 的 times 数 组 参数 的 第 一 个 元 素 包 含 访问 时 间 ， 第 二 元 素 
包含 修改 时 间 。 这 两 个 时 间 值 是 日 历时 间 ， 如 1.10 节 所 述 ， 这 是 自 特 定 
— 《1970 年 1 月 1 日 00:00:00) 以 来 所 经 过 的 秒 数 。 不 足 秒 的 部 分 用 纳 
秒表 示 。 

时 间 惟 可 以 按 下 列 4 种 方式 之 一 进行 指定 。 

(1) 如 果 times 参 数 是 一 个 空 指针 ， 则 访问 时 间 和 修改 时 间 两 者 都 
设置 为 当前 时 间 。 

(2) 如 果 times 参 数 指 癌 两 个 timespec 结 构 的 数组 ， 任 一 数组 元 素 
的 tv_nsec 字 有 段 的 值 为 UTIME_NOW， 相 应 的 时 间 玲 就 设置 为 当前 时 间 ， 
忽略 相应 的 tv_sec 字 段 。 

(3) 如 果 times 参 数 指 癌 两 个 timespec 结 构 的 数组 ， 任 一 数组 元 素 
的 tv_nsec 字 上段 的 值 为 UTIME_OMIT， 相 应 的 时 间 惟 保持 不 变 ， 忽 略 相 
应 的 tv_sec 字 上 段 。 

(4) WÈ times 参数 指 同 两 个 timespec 结构 的 数组 ， 且 tv_nsec 字 
段 的 值 为 既 不 是 UTIME_NOW 也 不 是 UTIME_OMIT， 在 这 种 情况 下 ， 
相应 的 时 间 惟 设置 为 相应 的 tv_sec 和 tv_nsec 字 段 的 值 。 

ANE X EE pe A AT BE EEN AF times AAE - 

如 果 times 是 一 个 空 指针 ， 或 者 任 一 tv_nsec 字 段 设 为 
UTIME_Now, 则 进程 的 有 效用 户 ID 必须 等 于 该 文件 的 所 有 者 ID; 进程 
对 该 文件 必须 具有 写 权 限 ， 或 者 进程 是 一 个 超级 用 户 进 程 。 

。 如 果 times 是 非 空 指针 ， 并 且 任 一 tv_nsec 字段 的 值 既 不 是 
UTIME_NOW 也 不 是 UTIME_OMIT， 则 进程 的 有 效用 户 ID 必 须 等 于 该 
文件 的 所 有 者 ID， 或 者 进程 必须 是 一 个 超级 用 户 进程 。 对 文件 只 具有 写 
权限 是 不 够 的 。 




















。 如 果 times 是 非 空 指针 ， 并 且 两 个 tv_nsec 字 段 的 值 都 为 
UTIME_OMIT， 就 不 执行 任何 的 权限 检查 。 
futimens 函数 需要 打开 文件 来 更 改 它 的 时 间 ，utimensat 函数 提供 了 
一 种 使 用 文件 名 更 改 文 件 时 间 的 方法 。pathname 人 参数 是 相对 于 fd 参数 进 
行 计算 的 ，fd 要 么 是 打开 目录 的 文件 描述 符 ， 要 么 设置 为 特殊 值 
AT_FDCWD〔 强 制 通 过 相对 于 调用 进程 的 当前 目录 计算 pathname) 。 
如 果 pathname 指 定 了 绝对 路 径 ， 那 么 fd 参数 被 忽略 。 
utimensat 的 flag 参 数 可 用 于 进一步 修改 默认 行为 。 如 果 设 置 了 
AT_SYMLINK_NOFOLLOW 标 志 ， 则 符号 链接 本 身 的 时 间 就 会 被 修改 
(如 果 路 径 名 指 问 符 号 链接 ) 。 默 认 的 行为 是 跟随 符号 链接 ， 并 把 文件 
的 时 间 改 成 符号 链接 的 时 间 。 
futimens 和 utimensat 函数 都 包含 在 POSIX.1 中 ， 第 3 个 国 数 utimes 
包含 在 Single UNIX Specification 的 XSI 扩 展 选 项 中 。 
#include <sys/time.h> 
int utimes(const char *pathname, const struct timeval times[2]); 
函数 返回 值 : ARJ, Beo; Am, El- 
utimes 函 数 对 路 径 名 进行 操作 。times 参 数 是 指向 包含 两 个 时 间 惟 
《访问 时 间 和 修改 时 间 ) 元 素 的 数组 的 指针 ， 两 个 时 间 戳 是 用 秒 和 微妙 
表示 的 。 
struct timeval { 
time_t tv_sec; /* seconds */ 
long tv_usec; /* microseconds */ 


}; 

注意 ， 我 们 不 能 对 状态 更 改 时 间 st_ctim (i 节点 最 近 被 修改 的 时 
间 〉 指 定 一 个 值 ， 因 为 调用 utimes 函 数 时 ， 此 字段 会 被 自动 更 新 。 

在 某 些 UNIX 版 本 中 ，touch(1) 命 令 使 用 这 些 函 数 中 的 某 一 个 。 另 
外 ， 标 准 归 档 程 序 tar(1) 和 cpio(1) 可 选 地 调用 这 些 函 数 ， 以 便 将 一 个 文件 
pe eee 
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图 4-21 的 程序 使 用 带 O_TRUNC 选 项 的 open 函 数 将 文件 长 度 截断 为 
0， 但 并 不 更 改 其 访问 时 间 及 修改 时 间 。 为 了 做 到 这 一 点 ， 首 先 用 stat 函 
数 得 到 这 些 时 间 ， 然 后 截断 文件 ， 最 后 再 用 futimens 函 数 重 置 这 两 个 时 
间 。 可 以 用 以 下 Linux 命 令 演 示 图 4-21 中 的 程序 : 























finclude "apue.h" 
finclude <fentl.h> 


int 
main(int argc, char *argv{]) 
| 
int 1; fd 
struct stat statbuf; 
struct timespec times[2]; 
for (1 = 1; 1 < argc; itt) { 
if (stat(argv[i], éstatbuf) < 0) { /* fetch current times */ 
err ret ("%s: stat error", argv(i]); 
continue; 
if ((fd = open(argv[i], O_RDWR | O TRUNC)) < 0) { /* truncate */ 
err_ret("%s: open error", argv(i]); 
continue; 
times[0] = statbuf.st_atim; 
times[1] = statbuf.st_mtim; 
if (futimens(fd, times) < 0) /* reset times */ 
err ret("%s: futimens error", argv[i]); 
close (fd) ; 
} 


exit 0); 


图 4-21 futimens 函 数 实例 


$ ls -1 changemod times 但 看 长 度 和 最 后 修改 时 间 
-rwxr-xr-x 1 sar 13792 Jan 22 01:26 changemod 

-rwxr-xr-x 1 sar 13824 Jan 22 01:26 times 

$ Is -lu changemod times 但 看 最 后 访问 时 间 
-rwxr-xr-x 1 sar 13792 Jan 22 22:22 changemod 

-rwxr-xr-x 1 sar 13824 Jan 22 22:22 times 





$ date 打印 当天 日 期 Fri Jan 27 
20:53:46 EST 2012 

$ ./a.out changemod times 运行 图 4-21 的 程序 

$ Is -] changemod times 检查 结果 
-TWXT-XT-X 1 sar 0 Jan 22 01:26 changemod 
-rWxr-xr-x 1 sar 0 Jan 22 01:26 times 

$ Is -lu changemod times 检查 最 后 访问 时 间 
-rWXT-XT-X 1 sar 0 Jan 22 22:22 changemod 
-rwxr-xr-x 1 sar 0 Jan 22 22:22 times 

$ Is -lc changemod times 检查 状态 更 改 时 间 
-rWXT-XT-X 1 sar 0 Jan 27 20:53 changemod 
-rwxr-xr-x 1 sar 0 Jan 27 20:53 times 





正如 我 们 所 预见 的 一 样 ， 最 后 修改 时 间 和 最 后 访问 时 间 未 变 。 但 
状态 更 改 时 间 则 更 改 为 程序 运行 时 的 时 间 。 





4.21 负数 mkdir、mkdirat 和 rmdir 


用 mkdir 和 mkdirat 函 数 创建 目录 ， 用 rmdir 函 数 删 除 目 录 。 

#include <sys/stat.h> 

int mkdir(const char *pathname, mode_t mode); 

int mkdirat(int fd, const char *pathname, mode_t mode); 

两 个 函数 返回 值 ， 帮 成功， 返回 0; 在 出 错 ， 返 回 -1 

这 两 个 函数 创建 一 个 新 的 空 目录 。 其 中 ，. 和 .. 目 录 项 是 自动 创建 
的 。 所 指定 的 文件 访问 权限 mode 由 进程 的 文件 模式 创建 屏蔽 字 修 改 。 

常见 的 错误 是 指定 与 文件 相同 的 mode (只 指定 读 、 写 权限 ) 。 但 
是 ， 对 于 目录 通常 至 少 要 设置 一 个 执行 权限 位 ， 以 允许 访问 该 目录 中 的 
文件 名 (见习 题 4.16) 。 

按照 4.6 节 中 讨论 的 规则 来 设置 新 目录 的 用 户 ID 和 组 ID。 

Solaris 10 和 Linux 3.2.0 也 使 新 目录 继承 父 目 录 的 设置 组 ID 位 。 这 就 
使 得 在 新 目录 中 创建 的 文件 将 继承 该 目录 的 组 ID。 对 于 Linux， 文 件 系 
统 的 实现 决定 是 否 文 持 此 特征 。 例 如 ，ext2、ext3 和 ext4 文 件 系统 用 
mount(1) 命 令 的 一 个 选项 来 控制 是 否 支 持 此 特征 。 但 是 ，Linux 的 UFS 文 
件 系 统 实现 则 是 不 可 选择 的 ， 新 目录 继承 父 目 录 的 设置 组 ID 位 ， 这 仿效 
了 历史 上 BSD 的 实现 。 在 BSD 系 统 中 ， 新 目录 的 组 ID 是 从 父 目 录 继 承 


的 。 

基于 BSD 的 系统 并 不 要 求 在 目录 间 传 递 设置 组 ID 位 ， 因 为 不 论 设置 
组 ID 位 如 何 ， 新 创建 的 文件 和 目录 总 是 继承 父 目 录 的 组 ID 。 因 为 
FreeBSD 8.0 和 Mac OS X 10.6.8 是 基于 4.4BSD 的 ， 它 们 不 要 求 继承 设置 
组 ID 位 。 在 这 些 平 台 上 ， 新 创建 的 文件 和 目录 总 是 继承 父 目 录 的 组 
ID， 这 与 是 否 设置 了 设置 组 ID 位 无 关 。 

早期 的 UNIX 版 本 并 没有 mkdir 函 数 ， 它 是 由 4.2BSD 和 SVR3 引 入 
的 。 在 早期 版 本 中 ， 进 程 要 调用 mknod 函 数 创建 一 个 新 目录 ， 但 是 只 有 
超级 用 户 进程 才能 使 用 mknod 函 数 。 为 了 避免 这 一 点 ， 创 建 目 录 的 命令 
mkdir() 必 须 由 根 用 户 拥 有 ， 而 且 对 它 设 置 了 设置 用 户 ID 位 。 要 通过 一 
个 进程 创建 一 个 目录 ， 必 须 用 system(3) 函 数 调 用 mkdir(1) 命 令 。 

mkdirat 函 数 与 nkdir 函 数 类 似 。 当 fd 参数 具有 特殊 值 AT_FDCWD 或 
者 pathname 参 数 指定 了 绝对 路 径 名 时 ，mkdirat 与 mkdir 完 全 一 样 。 人 否 
则 ，fd 参 数 是 一 个 打开 目录 ， 相 对 路 径 名 根据 此 打开 目录 进行 计算 。 

用 rmdir 函 数 可 以 删除 一 个 空 目 录 。 空 目录 是 只 包含 .和 .. 这 两 项 的 目 












































#include <unistd.h> 
int rmdir(const char *pathname); 
返回 值 : ERJ, GIO; AR, eE- 

如 果 调 用 此 函数 使 目录 的 链接 计数 成 为 0， 并 且 也 没有 其 他 进程 打 
开 此 目录 ， 则 释放 由 此 目录 占用 的 空间 。 如 果 在 链接 计数 达到 0 时 ， 有 
一 个 或 多 个 进程 打开 此 目录 ， 则 在 此 函数 返回 前 删除 最 后 一 个 链接 及 . 
和 .. 项 。 另 外 ， 在 此 目录 中 不 能 再 创建 新 文件 。 但 是 在 最 后 一 个 进程 关 
闭 它 之 前 并 不 释放 此 目录 。 即使 男 一 些 进程 打开 该 目录 ， 它 们 在 此 日 
录 下 也 不 能 执行 其 他 操作 。 这 样 处 理 的 原因 是 ， 为 了 使 rmndir 函 数 成 功 
执行 ， 该 目录 必须 是 空 的 。) 
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防止 文件 系统 产生 混乱 ， 只 有 内 核 才能 写 目 录 。 回 忆 45 节 ， 一 个 目录 
的 写 权 限 位 和 执行 权限 位 决定 了 在 该 目录 中 能 侣 创建 新 文件 以 及 删除 文 
件 ， 它 们 并 不 表示 能 个 写 目 录 本 身 。 

目录 的 实际 格式 依赖 于 UNIX 系统 实现 和 文件 系统 的 设计 。 早 期 的 
系统 (如 V7) 有 一 个 比较 简单 的 结构 : 每 个 目录 项 是 16 个 字 节 ， 其 中 
14 个 字 贡 是 文件 名 ，2 个 字 节 是 i 节 点 编号 。 而 对 于 4.2BSD， 由 于 它 人 允许 
更 长 的 文件 名 ， 所 以 每 个 目录 项 的 长 度 是 可 变 的 。 这 就 意味 着 读 目 录 的 
程序 与 系统 相关 。 为 了 简化 读 目录 的 过 程 ，UNIX 现在 包含 了 一 套 与 目 
录 有 关 的 例 程 ， 它 们 是 POSIX.1 的 一 部 分 。 很 多 实现 阻止 应 用 程序 使 用 
read 函 数 读 取 目 录 的 内 容 ， 由 此 进一步 将 应 用 程序 与 目录 格式 中 与 实现 
相关 的 细节 隔离 。 

#include <dirent.h> 

DIR *opendir(const char *pathname); 

DIR *fdopendir(int fd); 

两 个 函数 返回 值 : ARJ, GRIST; ces, J IEINULL 
struct dirent *readdir(DIR *dp); 
返回 值 : RD), BEE: 知 在 目录 尾 或 出 错 ， 返 回 NULL 
void rewinddir(DIR *dp); 
int closedir(DIR *dp); 









































返回 值 : ARJ, IO; Aht, e- 


返回 值 ， 与 dp 关联 的 目录 中 的 当前 位 置 

void seekdir(DIR *dp, long loc); 

fdopendir 函 数 最 早出 现在 SUSv4 (Single UNIX Specification 第 4 版 ) 
中 ， 它 提供 了 一 种 方法 ， 可 以 把 打开 文件 描述 符 转 换 成 目录 处 理 函 数 需 
要 的 DIR 结 构 。 

telldir 和 seekdir 函数 不 是 基本 POSIX.1 标准 的 组 成 部 分 。 它 们 是 
Single UNIX Specification 中 的 XSI 扩 展 ， 所 以 可 以 期 望 所 有 符合 UNIX 系 
统 的 实现 都 会 提供 这 两 个 函数 。 
pi SA 
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long telldir(DIR *dp); 





定义 在 头 文件 <dirent.h> 中 的 dirent 结 构 与 实现 有 关 。 实 现 对 此 结构 
所 做 的 定义 至 少 包含 下 列 两 个 成 员 : 

ino_t d_ino; /* i-node number */ 

char d_name[]; /* null-terminated filename */ 

POSIX.1 并 没有 定义 d_ino 项 ， 因 为 这 是 一 个 实现 特征 ， 但 在 
POSIX.1 的 XSI 扩 展 中 定义 了 d_ino。POSIX.1 在 此 结构 中 只 定义 了 
d_name 项 。 

注意 ，d_name 项 的 大 小 并 没有 指定 ， 但 必须 保证 它 能 包含 至 少 
NAME_MAX 个 字 节 〈 不 包含 终止 null 字 节 ， 回 忆 图 2-15) 。 因 为 文件 名 
是 以 null 字 节 结 束 的 ， 所 以 在 头 文 件 中 如 何 定 义 数组 d_name 并 无 多 大 关 
系 ， 数 组 大 小 并 不 表示 文件 名 的 长 度 。 

DIR 结构 是 一 个 内 部 结构 ， 上 述 7 个 函数 用 这 个 内 部 结构 保存 当前 
正在 被 读 的 目录 的 有 关 信 息 。 其 作用 类 似 于 FILE 结 构 。FILE 结 构 由 标 
准 VO 库 维护 ， 我 们 将 在 第 5 章 中 对 它 进行 说 明 。 

由 opendir 和 fdopendir 返 回 的 指 同 DIR 结 构 的 指针 由 男 外 5 个 函数 使 
用 。opendir 执 行 初始 化 操作 ， 使 第 一 个 readdir 返 回 目录 中 的 第 一 个 目录 
项 。DIR 结 构 由 fdopendir 创 建 时 ，readdir 返 回 的 第 一 项 取决 于 传 给 
fdopendir 函 数 的 文件 描述 符 相 关联 的 文件 偏 移 量 。 注 意 ， 目 录 中 各 目录 
项 O 关 。 它 们 通常 并 不 按 字 母 顺序 排列 。 
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的 程序 ， 其 目的 是 得 到 如 图 4-4 中 所 示 的 各 种 类 型 的 文件 计数 。 图 4-22 的 
程序 只 有 一 个 参数 ， 它 说 明 起 点 路 径 名 ， 从 该 点 开始 递归 降序 遍历 文件 
层次 结构 。Solaris 提 供 了 一 个 遍历 此 层次 结构 的 函数 ”ftw(3)， 对 于 每 一 
个 文件 它 都 调用 一 个 用 户 定 义 的 函数 。ftw ”函数 的 问题 是 : 对 于 每 一 个 
文件 ， 它 都 调用 stat 函 数 ， 这 就 使 程序 跟随 符号 链接 。 例 如 ， 如 果 从 根 
目录 (root) 开始 ， 并 且 有 一 个 名 为 /iib 的 符号 链接 ， 它 指 癌 /usvlib， 则 
所 有 在 目录 /usrvlib 中 的 文件 都 会 被 计数 两 次 。 为 了 纠正 这 一 点 ，Solaris 
提供 了 男 一 个 函数 ”nftw(3)， 它 具有 一 个 停止 跟随 符号 链接 的 选项 。 尺 
管 可 以 使 用 nftw， 但 是 为 了 说 明 目 录 例 程 的 使 用 方法 ， 我 们 还 是 编写 了 
一 个 简单 的 文件 遍历 程序 。 

在 SUSv4 中 ，nftw 包 含 在 XSI 选 项 中 。FreeBSD 8.0、Linux 3.2.0、 
Mac OS X 10.6.8 以 及 Solaris 10 都 包括 了 该 函数 的 实现 。 在 SUSv4 中 ， 
ftw 函 数 已 被 标记 为 弃 用 。) 基于 BSD 的 UNIX 系 统 则 有 另 一 个 函数 
fts(3)， 它 提供 类 似 的 功能 。 该 函数 在 FreeBSD 8.0. Linux 3.2.0 和 Mac 
OS X 10.6.8 中 是 可 用 的 。 























finclude "apue ,hn 
include <dirent.h> 
finclude <limits.h> 


/* function type that is called for each filename */ 
typedef int Myfunc(const char *, const struct stat *, int)? 


static Myfunc myfunc; 

static int myftw(char *, Myfunc *); 

static int dopath (Myfunc *); 

static long nreg, ndir, nblk, nchr, nfifo, nslink, nsock, ntot; 


int 
main(int argc, char *argv[]) 


{ 


int ret; 
if (arge != 2) 
err_quit("usage: ftw <starting-pathname>") ; 
ret = myftw(argv[1], myfunc); /* does it all */ 
ntot = nreg + ndir + nblk + nchr + nfifo + nslink + nsock; 
if (ntot == 0) 
ntot = 1; /* avoid divide by 0; print 0 for all counts 
printf ("regular files = %7l1ld, %5.2f %%\n", nreg, 
nreg*100.0/ntot) ; 
printf ("directories = $71ld, $5.2£ $$\n", ndir, 
ndir*100.0/ntot) ; 
printf ("block special = %7ld, %5.2f %%\n", nblk, 


nb1k*100.0/ntot) ; 

printf ("char special 
nchr*100.0/ntot) ; 

printf ("FIFOs = $7l1ld, %5.2f£ tiin"; nfifo, 
nfifo*100.0/ntot); 

printf ("symbolic links = %7ld, %5.2f %%\n", nslink, 
nslink*100.0/ntot) ; 

printf ("sockets = $71d, %5.2£ %¢\n", nsock, 
nsock*100.0/ntot); 

exit (ret); 
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} 


/* 

* Descend through the hierarchy, starting at "pathname". 

* The caller's func() is called for every file. 

af 

#define FTW F 1 /* file other than directory */ 

#define FTW_D 2 /* directory */ 

#define FTW DNR 3 /* directory that can't be read */ 

#define FTW_NS 4 /* file that we can't stat */ 

static char *fullpath; /* contains full pathname for every file */ 


static size_t pathlen; 


static int /* we return whatever func() returns */ 
myftw(char *pathname, Myfunc *func) 
{ 
fullpath = path_alloc(&pathlen); /* malloc PATH_MAX+1 bytes */ 
/* ({Flgure 2.16}) */ 
if (pathlen <= strlen(pathname)) { 
pathlen = strlen(pathname) * 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 
err_sys("realloc failed"); 


ay 


} 
strcpy (fullpath, pathname); 


return (dopath (func) ) > 


Descend through the hierarchy, starting at "“fullpath". 
If "“fullpath" is anything other than a directory, we lstat() it, 


* call func(), and return. For a directory, we call ourself 
recursively for each name in the directory. 

Sy 

static int /* we return whatever func() returns */ 


dopath (Myfunc* func) 


{ 


} 


struct stat statbuf; 
struct dirent Adi ep}; 
DIR *dp; 
int ret, n; 


if (lstat(fullpath, é&statbuf) < 0) /* stat error */ 
return (func(fullpath, &statbuf, FTW_NS)); 
if (S_ISDIR(statbuf.st_mode) == 0) /* not a directory */ 
return(func(fullpath, &statbuf, FTW_F)); 
JR 
* It's a directory. First call func() for the directory, 
* then process each filename in the directory. 
xf 
if ((ret = func(fullpath, &statbuf, FTW_D)) t= 0) 
return (ret); 
n = strien(fullpath) ; 


if (m + NAME MAX + 2 > pathlen) { /* expand path buffer */ 
pathlen *= 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 


err_sys("realloc failed"); 


} 


fullpath[n++] = '/'; 
fullpath[n] = 0; 
if ((dp = opendir(fullpath)) == NULL) /* can't read directory */ 
return (func(fullpath, &statbuf, FTW_DNR)); 
while ((dirp = readdir(dp)) != NULL) { 
if (strcmp (dirp->d_name, ".") == 0 | 
stroemp (dirp->d_name, "..") == 0) 
continue; /* ignore dot and dot-dot */ 
strepy(&fullpath[n], dirp->d name); /* append name after "/" */ 
if ((ret = dopath(func)) != 0) /* recursive */ 


break; /* time to leave */ 


} 


fullpath[n-1] = 0; /* erase everything from slash onward */ 
if (closedir(dp) < 0) 
err_ret ("can't close directory %s", fullpath); 


return (ret); 


Statre aint 
myfunc(const char *pathname, const struct stat *statptr, int type) 


{ 


switch (type) { 

case FINE 
switch (statptr->st_mode & S IFMT) | 
case 9 IFREG; nregtt; break; 
case S_IFBLK: nblktt; break; 
case 9 IFCHR: nchrtt; break; 
case 9 IFIFO: nfifott; break; 
case S IFLNK: nslinkt++; break; 
case S_IFSOCK: nsocktt+; break; 
case 9 IFDIR: /* directories should have type = FIWD */ 

err dump ("for S IFDIR for %s", pathname) ; 





} 
break; 
case FTW D: 
ndirtt; 
break; 
case FTW DNR; 
err ret ("can't read directory %s", pathname); 
break; 
case FTW NS; 
err ret ("stat error for ts", pathname) ; 
break; 
default: 
err dump ("unknown type sd for pathname ts", type, pathname); 


return (0); 








图 4-22 递归 降 





序 遍 历 目录 层次 结构 ， 并 按 文件 类 型 计数 


在 程序 中 ， 我 们 提供 了 比 所 要 求 的 更 多 的 通用 性 ， 这 样 做 的 目的 是 
为 了 具体 说 明 ftw 和 nftw 函 数 的 应 用 。 例 如 ， 函 数 myfunc 总 是 返回 9， 即 
使 调用 它 的 函数 准备 了 人 处理 非 0 返回 也 是 如 此 。 

关于 降序 台历 文件 系统 的 更 多 信息 ， 以 及 在 很 多 标准 UNIX 命 令 
(如 find、ls、tar 等 ) 中 使 用 这 种 技术 的 情况 ， 请 参阅 Fowler、Korn 和 


Vo[1989]. 


4.23 呆 数 chdir、fchdir 和 getcwd 


每 个 进程 都 有 一 个 当前 工作 目录 ， 此 目录 是 搜索 所 有 相对 路 径 名 的 
起 点 《不 以 斜 线 开始 的 路 径 名 为 相对 路 径 名 ) 。 当 用 户 登 录 到 UNIX 系 
统 时 ， 其 当前 工作 目录 通常 是 口令 文件 Cetc/passwd) 中 该 用 户 登 录 项 
的 第 6 个 字段 一 用 户 的 起 始 目 录 (home directory) 。 当 前 工作 目录 是 进 
程 的 一 个 属性 ， 起 始 目录 则 是 登录 名 的 一 个 属性 。 

进程 调用 chdir 或 fchdir 函 数 可 以 更 改 当 前 工作 目录 。 

#include <unistd.h> 

int chdir(const char *pathname); 

int fchdir(int fd); 

两 个 函数 的 返回 值 : ARJ, GIO; Arte, e- 

在 这 两 个 函数 中 ， 分 别 用 pathname 或 打开 文件 描述 符 来 指定 新 的 当 
前 工作 目录 。 

实例 

因为 当前 工作 目录 是 进程 的 一 个 属性 ， 所 以 它 只 影响 调用 chdir 的 
进程 本 号 ， 而 不 影响 其 他 进程 〈 我 们 将 在 第 8 章 更 详细 地 说 明 进 程 之 间 
的 关系 )。 这 就 意味 着 图 4-23 的 程序 并 不 会 产生 我 们 可 能 希望 得 到 的 结 
IR o 


























#include "apue.h" 


int 
main (void) 
| 
if (chdir("/tmp") < 0) 
err sys("chdir failed"); 
printf ("chdir to /tmp succeeded\n") ; 
exit (0); 


图 4-23 chdir 函 数 实例 

如 果 编 译 图 4-23 程 序 ， 并 且 调 用 其 可 执行 目标 代码 文件 mycd， 则 可 
以 得 到 下 列 结果 : 

$ pwd 

/usr/lib 

$ mycd 

chdir to /tmp succeeded 

$ pwd 

/usr/lib 

从 中 可 以 看 出 ， 执 行 mycd 命 令 的 shell 的 当前 工作 目录 并 没有 改变 ， 
这 是 shell 执 行程 序 工作 方式 的 一 个 副作用 。 每 个 程序 运行 在 独立 的 进程 
H, shel 的 当前 工作 目录 并 不 会 随 着 程序 调用 chdir 而 改变 。 由 此 可 见 ， 
为 了 改变 shell 进 程 上 自己 的 工作 目录 ，shell 尿 当 直 接 调 用 chdir 函 数 ， 为 
此 ，cd 命 令 内 建 在 shell 中 。 

因为 内 核 必须 维护 当前 工作 目录 的 信息 ， 所 以 我 们 应 能 获取 其 当前 
值 。 遗 憾 的 是 ， 内 核 为 每 个 进程 只 保存 指 疝 该 目录 v 市 点 的 指针 等 目录 
本 身 的 信息 ， 并 不 保存 该 目录 的 完整 路 径 名 。 

Linux 内 核 可 以 确定 完整 路 径 名 。 完 整 路 径 名 的 各 个 组 成 部 分 分 布 
在 mount 表 和 dcache 表 中 ， 然 后 进行 章 新 组 装 ， 比 如 在 读 取 /proc/self/cwd 
符号 链接 时 。 

我 们 需要 一 个 函数 ， 它 从 当前 工作 目录 CO 开始， 用 .. 找 到 其 上 一 
级 目录 ， 然 后 读 其 目录 项 ， 直 到 该 目录 项 中 的 ji 点 编号 与 工作 目录 i 
点 编号 相同 ， 这 样 地 就 找到 了 其 对 应 的 文件 名 。 投 照 这 种 方法 ， 逐 层 上 
移 ， 直 到 过 到 根 ， 这 样 就 得 到 了 当前 工作 目录 完整 的 绝对 路 径 名 。 很 对 
运 ， 函 数 getcwd 就 提供 了 这 种 功能 。 

#include <unistd.h> 

char *getcwd(char *buf, s i z e_t size); 

返回 值 : 知 成 功 ， 返 回 buf; 知 出 错 ， 返 回 NULL 

必须 癌 此 函数 传递 两 个 参数 ， 一 个 是 缓冲 区 地 址 buf， 另 一 个 是 组 
冲 区 的 长 度 size《〈 以 字 节 为 单位 ) 。 该 缓冲 区 必须 有 足够 的 长 度 以 容纳 
绝对 路 径 名 再 加 上 一 个 终止 null 字 节 ， 否 则 返回 出 错 〈 请 回忆 2.5.5 节 中 
有 关 为 最 大 长 度 路 径 名 分 配 空间 的 讨论 ) 。 

某 些 getcwd 的 早期 实现 允许 第 一 个 参数 buf 为 NULL 。 在 这 种 情况 
下 ， 此 函数 调用 malloc 动 态 地 分 配 size 字 节 数 的 空间 。 这 不 是 POSIX.1 或 
Single UNIX Specification 的 所 属 部 分 ， 应 当 避 免 使 用 。 

实例 

图 4-24 的 程序 将 工作 目录 更 改 至 一 个 指定 的 目录 ， 然 后 调用 





















































getcwd， 最 后 打印 该 工作 目录 。 如 果 运 行 该 程序 ， 则 可 得 
$ ./a.out 
cwd = /var/spool/uucppublic 
$ Is -l /usr/spool 
Irwxrwxrwx 1 root 12 Jan 31 07:57 /usr/spool -> ../var/spool 


#include "apue,h" 
int 


main (void) 





char *ptr; 
size t size; 
if (chdir("/usr/spool/uucppublic") < 0) 
err sys("chdir failed"); 
ptr = path alloc(ésize); /* our own function */ 
if (getcwd(ptr, size) == NULL) 
err sys("getcwd failed"); 
printf ("cwd = $s\n", ptr); 
exit (0); 





图 4-24 getcwd 函 数 实例 

注意 ，chdir 跟 随 符号 链接 (正如 我 们 希望 的 ， 如 图 4-17 中 所 示 》， 
但 是 当 getcwd 沿 目录 树 上 淹 遇 到 /varspool 目录 时 ， 它 并 不 了 解 该 目录 由 
符号 链接 /asrspool 所 指 癌 。 这 是 符号 链接 的 一 种 特性 。 

当 一 个 应 用 程序 需要 在 文件 系统 中 返回 到 它 工 作 的 出 发 点 时 ， 
getcwd 函数 是 有 用 的 。 在 更 换 工 作 目 录 之 前 ， 我 们 可 以 调用 getcwd 函 数 
先 将 其 保存 起 来 。 在 完成 了 处 理 后 ， 就 可 将 所 保存 的 原 工 作 目 录 路 径 名 
作为 调用 参数 传送 给 chdir， 这 样 束 返回 到 了 文件 系统 中 的 出 发 点 。 

fchdir 函 数 癌 我 们 提供 了 一 种 完成 此 任务 的 便捷 方法 。 在 更 换 到 文 
件 系统 中 的 不 同位 置 前 ， 无 需 调 用 getcwd 函 数 ， 而 是 使 用 open 打 开 当 前 
工作 目录 ， 然 后 保存 其 返回 的 文件 描述 符 。 当 和 希望 回 到 原 工 作 目 录 时 ， 
只 要 简单 地 将 该 文件 描述 符 传 送 给 fchdir。 








4.24 设备 特殊 文件 


st_dev 和 st_rdev 这 两 个 字段 经 常 引 起 混 请 ， 在 18.9 节 ， 我 们 编写 
ttyname 国 数 时 ， 需 要 使 用 这 两 个 字段 。 有 关 规 则 很 简单 : 

“每 个 文件 系统 所 在 的 存储 设备 都 由 其 主 、 次 设备 号 表示 。 设 备 号 
所 用 的 数据 类 型 是 基本 系统 数据 类 型 dev_t。 主 设备 号 标识 设备 驱动 程 
序 ， 有 时 编码 为 与 其 通信 的 外 设 板 ; 次 设备 号 标识 特定 的 子 设备 。 回 忆 
图 4-13， 一 个 磁盘 驱动 器 经 常 包含 耕 干 个 文件 系统 。 在 同一 磁盘 驱动 器 
上 的 各 文件 系统 通常 具有 相同 的 主 设备 写 ， 但 是 次 设备 号 却 不 同 。 

我们 通 第 可 以 使 用 两 个 宏 : major 和 minor 来 访问 主 、 次 设备 号 ， 大 
多 数 实 现 都 定义 这 两 个 宏 。 这 就 意味 着 我 们 无 需 关 心 这 两 个 数 是 如 何 存 
放 在 dev_t 对 象 中 的 。 

早期 的 系统 用 16 位 整 型 存放 设备 写 : 8 位 用 于 主 设备 写 ，8 位 用 于 次 
设备 号 。FreeBSD 8.0 和 Mac OS X 10.6.8 使 用 32 位 整 型 ， 其 中 8 位 表示 主 
设备 写 ，24 位 表示 次 设备 写 。 在 32 位 系统 中 ，Solaris 10 用 32 位 整 型 表示 
dev t， 其 中 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。 在 64 位 系统 中 ， 
Solaris “10 用 64 位 整 型 表示 dev_t， 主 设备 号 和 次 设备 号 各 用 其 中 的 32 位 
表示 。 在 Linux 3.2.0 上 ， 虽 然 dev_t 是 64 位 整 型 ， 但 其 中 只 有 12 位 用 于 主 
设备 号 ，20 位 用 于 次 设备 号 。 

POSIX.1 说 明 dev_t 类 型 是 存在 的 ， 但 没有 定义 它 包 含 什么 ， 或 如 何 
取得 其 内 容 。 大 多 数 实现 定义 了 宏 major 和 minor， 但 在 哪 一 个 涉 文 件 中 
定义 它们 则 与 实现 有 关 。 基 于 BSD 的 UNIX 系 统 将 它们 定义 在 
<sys/types> 中 。Solaris 在 <sys/mkdev.h> 中 定义 了 它们 的 函数 原型 ， 因 为 
在 <sys/sysmacros.h> 中 的 宏 定义 都 弃 用 了 。Linux 将 它们 定义 在 
<SyS/Sysmacros.h> 中 ， 而 该 头 文件 又 包含 在 <sys/type.h> 中 。 

系统 中 与 每 个 文件 名 关联 的 st_dev 值 是 文件 系统 的 设备 号 ， 该 文 
件 系统 包含 了 这 一 文件 名 以 及 与 其 对 应 的 i 节 点 。 

“只 有 字符 特殊 文件 和 块 特殊 文件 才 有 st_rdev 值 。 此 值 包含 实际 设 
备 的 设备 号 。 

实例 

图 4-25 的 程序 为 每 个 命令 行 参 数 打印 设备 号 ， 另 外 ， 知 此 参数 引用 
的 是 字符 特殊 文件 或 块 特殊 文件 ， 则 还 打印 该 特殊 文件 的 st_rdev 值 。 

















#include "apue ,hn 
ifdef SOLARIS 
finclude <sys/mkdev.h> 
tendif 


int 
main(int argc, char *argv[]) 
| 
int Ly 
struct stat buf; 
for (1 = 1; 1 < argo; itt) { 
printf("ts: ", argv[i]); 
if (stat(argv[i], &buf) < 0) { 
err ret ("stat error"); 
continue; 
printf ("dev = %d/%d", major (buf.st_dev), minor (buf.st_dev)) ; 
if (S_ISCHR(buf.st_mode) || S_ISBLK(buf.st_mode)) { 
printf(" (%s) rdev = %d/%d", 


(9 ISCHR (buf, st mode)) ? "character" : "block", 
major (buf ,st rdev), minor (buf.st_rdev)); 
} 
printf ("\n"); 
} 
exit (0); 


图 4-25 打印 st_dev 和 st_rdev 值 

在 Linuxz 上 运行 此 程序 得 到 下 面 的 输出 : 

$ ./a.out / /home/sar /dev/tty[01] 

/: dev = 8/3 

/home/sar: dev = 8/4 

/dev/tty0: dev = 0/5 (character) rdev = 4/0 

/dev/tty1: dev = 0/5 (character) rdev = 4/1 

$ mount 哪些 目录 安装 在 哪些 设 
备 上 ? 

/dev/sda3 on / type ext3 (rw,errors=remount-ro,commit=0) 

/dev/sda4 on /home type ext2 (rw,commit=0) 

$ Is -l1 /dev/tty[01] /dev/sda[34] 

brw-rw---- 1 root 8, 3 2011-07-01 11:08 /dev/sda3 

brw-rw---- 1 root 8, 4 2011-07-01 11:08 /dev/sda4 

crw--w---- 1 root 4, 0 2011-07-01 11:08 /dewtty0 

CTW------- 1 root 4, 1 2011-07-01 11:08 /dev/tty1 

传 给 该 程序 的 前 两 个 参数 是 目录 〈/ 和 /home/sar) ， 后 两 个 参数 是 
设备 名 /dev/tty[01]。 (我 们 用 shell 正则 表达 式 语 言 以 缩短 所 需 的 输入 
量 。shell 将 字符 串 /dev/tty[01] 扩 展 为 /dev/tty0 /dewtty1。 ) 

我 们 期 望 设备 是 字符 特殊 文件 。 从 程序 的 输出 可 见 ， 根 目录 
和 /home/sar 目录 的 设备 号 不 同 ， 这 表示 它们 位 于 不 同 的 文件 系统 中 。 运 
行 mount(1) 命 令 可 以 证 明了 这 一 点 

然后 用 ]s 命 令 查 看 由 mount 命 令 今 报告 的 两 个 磁盘 设备 和 两 个 终端 设 
备 。 这 两 个 磁盘 设备 是 蒜 特 殊 文 件 ， 而 两 个 终端 设备 是 字符 特殊 文件 。 

(通常 ， 只 有 那些 包含 随机 访问 文件 系统 的 设备 类 型 是 块 特殊 文件 设 

备 ， 如 硬盘 驱动 器 、 软 盘 驱动 器 和 CD-ROM 等 。UNIX 的 早期 版 本 支持 

















磁带 存放 文件 系统 ， 但 这 从 未 广泛 使 用 过 。 ) 

注意 ， 两 个 终端 设备 〈st_dev) 的 文件 名 和 i 节点 在 设备 0/5 上 
(devtmpfs 伪 文件 系统 ， 它 实现 了 /dev 文 件 系统 ) ， 但 是 它们 的 实际 设 
备 号 是 4/0 和 4/1。 


4.25 文件 访问 权限 位 小 结 


我 们 已 经 说 明了 所 有 文件 访问 权限 位 ， 其 中 某 些 位 有 多 种 用 途 。 图 
4-26 列 出 了 所 有 这 些 权限 位 ， 以 及 它们 对 普通 文件 和 目录 文件 的 作用 。 

最 后 9 个 常量 还 可 以 分 成 如 下 3 组 : 

S IRWXU = S_IRUSR | S_IWUSR | S_IXUSR 

S IRWXG = S_IRGRP | S_IWGRP | S_IXGRP 

S IRWXO = S_IROTH | S_IWOTH | S_IXOTH 


IHC 对 目录 的 


| 设置 用 户 JD PD!!! (未 使 用 ) 
S ISGID | 设置 组 D | 若 组 执行 位 设置 ， 则 执行 时 设置 有 效 | 将 在 目录 中 创建 的 新 文件 的 组 ID 


AD; 否则 全 强制 性 镇 起 作用 ASCH) | 设置 为 目录 的 组 ID 
ISVIX 在 交换 区 缓存 程序 正文 (车 支 持 ) | RIL AEE PIMA A dh 
许可 用 户 读 文 件 许可 用 户 读 目 录 项 
洗 可 用 户 写 文人 洗 可用 户 在 目录 中 册 除 和 创建 文件 
许可 用 户 执行 文件 许可 用 户 在 目录 中 搜索 给 定 路 公 名 





许可 组 写 文件 许可 组 在 目录 中 删除 和 创建 文件 
许可 组 执行 文件 许可 组 在 目 孙 中 搜索 给 定 路 径 名 
许可 其 他 谈 文 件 许可 其 他 读 目录 项 

许可 其 他 写 文件 许可 其 他 在 目录 中 删除 和 创建 文人 
许可 其 他 执行 文件 许可 其 他 在 目录 中 搜索 给 定 路 从 名 


图 4-26 文件 访问 权限 位 小 结 
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4.26 小 结 


本 章 内 容 围 绕 stat 函 数 ， 详 细 介 绍 了 stat 结 构 中 的 每 一 个 成 员 。 这 使 
我 们 对 UNIX 文 件 和 目录 的 各 个 属性 都 有 所 了 解 。 我 们 讨论 了 文件 和 目 
录 在 文件 系统 中 是 如 何 设计 的 以 及 如 何 使 用 文件 系统 命名 空间 。 对 文件 
和 目录 的 所 有 属性 以 及 对 文件 和 目录 进行 操作 的 所 有 函数 的 全 面 了 解 ， 
对 于 UNIX 编 程 是 非常 重要 的 。 





习题 


4.1 用 stat 函 数 蔡 换 图 4-3 程 序 中 的 lstat 函 数 ， 如 知 命令 行 参数 之 一 是 
符号 链接 ， 会 发 生 什 么 变化 ? 

4.2 “如 果 文 件 模式 创建 屏蔽 字 是 777〈 八 进 制 ) ， 结 果 会 怎样 ? 用 
shell 的 umask 命 令 验 证 该 结果 。 

4.3 ”关闭 一 个 你 所 拥有 文件 的 用 户 读 权限 ， 将 导致 拒绝 你 访问 自己 
的 文件 ， 对 此 进行 验证 。 

4.4 创建 文件 foo 和 和 bar 后， 运行 图 4-9 的 程序 ， 将 发 生 什 么 情况 ? 

4.5 ”4.12 节 中 讲 到 一 个 普通 文件 的 大 小 可 以 为 0， 同 时 我 们 又 知道 
st_size 字 段 是 为 目录 或 符号 链接 定义 的 ， 那 么 目录 和 符号 链接 的 长 度 是 
侍 可 以 为 0? 

4.6 编写 一 个 类 似 cp(1) 的 程序 ， 它 复制 包含 空洞 的 文件 ， 但 不 将 字 
节 0 写 到 输出 文件 中 去 。 

4.7 在 4.12 节 ]s 命 令 的 输出 中 ，core 和 core.copy 的 访问 权限 不 同 ， 如 
果 创 建 两 个 文件 时 umask 没 有 变 ， 说 明 为 什么 会 有 发 生 这 种 差别 。 

4.8 在 运行 图 4-16 的 程序 时 ， 使 用 了 df(G) 命 令 来 检查 空闲 的 磁盘 空 
间 。 为 什么 不 使 用 du(1) 命 令 ? 

本 图 4-20 中 显示 unlink 函 数 会 修改 文件 状态 更 改 时 间 ， 这 是 怎样 发 

4? 

p he 4.22 节 中 ， 系 统 对 可 打开 文件 数 的 限制 对 myftw 函 数 会 产生 什 
么 影响 ? 

4.11 在 4.22 节 中 的 myftw 从 不 改变 其 目录 ， 对 这 种 处 理 方 法 进行 改 
动 : 每 次 遇 到 一 个 目录 就 用 其 调用 chdir， 这 样 每 次 调用 lstat 时 就 可 以 使 
用 文件 名 而 非 路 径 名 ， 处 理 完 所 有 的 目录 项 后 执行 chdir("..")。 比 较 这 种 
版 本 的 程序 和 书 中 程序 的 运行 时 间 。 

4.12 每 个 进程 都 有 一 个 根 目 录用 于 解析 绝对 路 径 名 ， 可 以 通过 
函数 改变 根 目 录 。 在 手册 中 碍 阅 此 函数 。 说 明 这 个 函数 什么 时 候 


4.13 如 何 只 设置 两 个 时 间 值 中 的 一 个 来 使 用 utimes 函 数 ? 

4.14 有 些 版 本 的 finger(1) 命 令 输 出 “New mail received ...” 和 “unread 
n” .…”， 其 中 ... 表 示 相 应 的 日 期 和 时 间 。 程 序 是 如 何 决 定 这 些 日 期 和 
时 间 的 ? 

4.15 用 cpio(1) 和 tar(1) 命 令 检 查 档案 文件 的 格式 请 参阅 《UNIX 程 














序 员 手 册 》 第 5 部 分 中 的 说 明 ) 。3 ”个 可 能 的 时 间 值 中 哪 几 个 是 为 每 一 
个 文件 保存 的 ? 你 认为 文件 复原 时 ， 文 件 的 访问 时 间 是 什么 ? 为 什么 ? 

416 ”UNIX 系统 对 目录 树 的 深度 有 限制 吗 ? 编写 一 个 程序 循环 ， 在 
每 次 循环 中 ， 创 建 目 录 ， 并 将 该 目录 更 改 为 工作 目录 。 确 保 叶 节点 的 绝 
对 路 径 名 的 长 度 大 于 系统 的 PATH_MAX 限制 。 可 以 调用 getcwd 得 到 有 目 
录 的 路 径 名 吗 ? 标准 UNIX 系 统 工具 是 如 何 处 理 长 路 径 名 的 ? 对 目录 可 
以 使 用 tar 或 cpio 命 令 归 档 吗 ? 

4.17 3.16 节 中 描述 了 /dev/fd 特征 。 如 果 每 个 用 户 都 可 以 访问 这 些 文 
件 ， 则 其 访问 权限 必须 为 rw-rw-rw-。 有 些 程序 创建 输出 文件 时 ， 先 删除 
该 文件 以 确保 该 文件 名 不 存在 ， 忽 略 返 回 码 。 

unlink (path); 

if ( (fd = creat(path, FILE_MODE)) < 0) 

err_sys(...); 
如 果 path 是 /dev/fd/1， 会 出 现 什么 情况 ? 














Bote 标准 VO 


5.1 51S 


本 章 讲 述 标准 IO 库 。 不 仅 是 UNIX， 很 多 其 他 操作 系统 都 实现 了 标 
准 IJO 库 ， 所 以 这 个 库 由 ISO C 标 准 说 明 。Single UNIX Specification 对 
ISO C 标 准 进行 了 扩充 ， 定 义 了 另外 一 些 接口 。 

标准 IO 库 处 理 很 多 细节 ， 如 组 种 区 分 配 、 以 优化 的 块 长 度 执行 IO 
等 。 这 些 处 理 使 用 户 不 必 担 心 如 何 选 择 使 用 正确 的 块 长 度 〈 如 3.9 节 中 
所 述 ) 。 这 使 得 它 便于 用 户 使 用 ， 但 是 如 果 我 们 不 深入 地 了 解 O 库 函 
数 的 操作 ， 也 会 带 来 一 些 问题 。 

标准 IO 库 是 由 Dennis Ritchie 在 1975 年 左右 编写 的 。 它 是 Mike Lesk 
编写 的 可 移植 IO 库 的 主要 修改 版 本 。 令 人 惊讶 的 是 ，35 年 来 ， 几 乎 没 
有 对 标准 IO 库 进 行 修 改 。 





5.2 ii FUFILEX 


在 第 3 章 中 ， 所 有 LO 函数 都 是 围绕 文件 描述 符 的 。 当 打开 一 个 文件 
时 ， 即 返回 一 个 文件 描述 符 ， 然 后 该 文件 描述 符 就 用 于 后 续 的 MO 操 
作 。 而 对 于 标准 WO 库 ， 它 们 的 操作 是 围绕 流 (stream) BEATIN CZ 
标准 IO 术语 流 与 System V 的 STREAMS IO 系统 相 混淆 ，STREAMS I/O 
系统 是 System V 的 组 成 部 分 ，Single UNIX Specification 则 将 其 标准 化 为 
XSI STREAMS 选 项 ， 但 是 在 SUSv4 中 已 经 将 其 标记 为 弃 用 ) 。 当 用 标 
准 I/O 库 打开 或 创建 一 个 文件 时 ， 我 们 已 使 一 个 流 与 一 个 文件 相关 联 。 

对 于 ASCI[ 字 符 集 ， 一 个 字符 用 一 个 字 节 表示 。 对 于 国际 字符 集 ， 
一 个 字符 可 用 多 个 字 节 表示 。 标 准 1O 文 件 流 可 用 于 单字 节 或 多 字 节 
(“ 宽 ”) 字符 集 。 流 的 定向 (stream's orientation) 决定 了 所 读 、 写 的 字 
符 是 单字 市 还 是 多 字 节 的 。 当 一 个 流 最 初 被 创建 时 ， 它 并 没有 定 癌 。 如 
若 在 未 定向 的 流 上 使 用 一 个 多 字 节 IO 函数 〈 见 <wchar.h>) ， 则 将 该 流 
的 定 癌 设置 为 宽 定 癌 的 。 知 在 未 定 同 的 流 上 使 用 一 个 单字 节 IJO 函 数 ， 
则 将 访 流 的 定 同 设 为 字 节 年 同 的 。 只 有 两 个 图 数 可 改变 流 的 定 同 。 
freopen 函 数 〈 稍 后 讨论 ) 清除 一 个 流 的 定 同 ; fwide 函 数 可 用 于 设置 流 
的 定 问 。 

#include <stdio.h> 

#include <wchar.h> 

int fwide(FILE *fp, int mode); 
返回 值 : Ae EIA, (RIE; ATES EIA, JE; 

A Vite ARE IAA, I [BIO 

根据 mode 参 数 的 不 同 值 ，fwide 函 数 执行 不 同 的 工作 。 

“如 大 mode 参 数值 为 人 负 ，fwide 将 试图 使 指定 的 流 是 字 节 定 问 的 。 

“如 大 mode 参 数值 为 正 ，fwide 将 试图 使 指定 的 流 是 客 定 同 的 。 

“如 条 mode 参 数值 为 0，fwide 将 不 试图 设置 流 的 定 同 ， 但 返回 标识 
该 流 定向 的 值 。 

注意 ，fwide 并 不 改变 已 定 同 流 的 定向 。 还 应 注意 的 是 ，fwide 无 出 
音 返 回 。 试 想 ， 如 知 流 是 无 效 的， 那么 将 发 生 什 么 呢 ? 我 们 唯一 可 依靠 
的 是 ， 在 调用 fwide 前 先 清 除 errmo， 从 fwide 返 回 时 检查 errno 的 值 。 在 
本 书 的 其 余部 分 ， 我 们 只 涉及 字 节 定 问 流 。 

当 打 开 一 个 流 时 ， 标 准 WO 函 数 fopen( 参 考 5.5 节 ) 返回 一 个 指 问 
FILE 对 象 的 指针 。 该 对 象 通常 是 一 个 结构 ， 它 包含 了 标准 WO 库 为 管理 




















该 流 需要 的 所 有 信息 ， 包 括 用 于 实际 IO 的 文件 描述 符 、 指 回 用 于 该 流 
an 区 的 指针 、 组 冲 区 的 长 度 、 当 前 在 缓冲 区 中 的 字符 数 以 及 出 错 标志 


应 用 程序 没有 必要 检验 FILE 对 象 。 为 了 引用 一 个 流 ， 需 将 FILE 指 
针 作 为 参数 传递 给 每 个 标准 WO 函 数 。 在 本 书 中 ， 我 们 称 指向 FILE 对 象 
的 指针 (类 型 为 FILE*) 为 文件 指针 。 

在 本 章 中 ， 我 们 在 UNIX 系 统 环境 中 说 明 标 准 MJO 库 。 正 如 前 述 ， 此 
标准 库 已 移植 到 UNIX 之 外 的 很 多 系统 中 。 但 是 为 了 说 明 该 库 实 现 的 一 
些 细节 ， 我 们 将 讨论 其 在 UNIX 系 统 上 的 典型 实现 。 


5.3 标准 输入 、 标 准 输 出 和 标准 错误 


对 一 个 进程 预定 义 了 3 个 流 ， 并 且 这 3 个 流 可 以 自动 地 被 进程 使 
用 ， 它 们 是 : 标准 输入 、 标 准 输出 和 标准 错误 。 这 些 流 引 用 的 文件 与 在 
3.2 ” 节 中 提 到 文件 描述 符 ”STDIN_FILENO、STDOUT FILENO 和 
STDERR_FILENO 所 引用 的 相同 。 

这 3 个 标准 WO 流通 过 预定 义 文件 指针 stdin、stdout 和 stderr 加 以 引 
用 。 这 3 个 文件 指针 定义 在 头 文件 <stdio.h> 中 。 


5.4 ZIP 


标准 VO 库 提 供 缓冲 的 目的 是 尽 可 能 减少 使 用 read 和 write 调 用 的 次 数 
( 见 图 3-6， 其 中 显示 了 在 不 同 缓冲 区 长 度 情况 下 ， 执 行 WO 所 需 的 CPU 
时 间 量 ) 。 它 也 对 每 个 IO 流 自 动 地 进行 缓冲 管理 ， 从 而 避免 了 应 用 程 
序 需要 考虑 这 一 点 所 带 来 的 麻烦 。 遗 憾 的 是 ， 标 准 IO 库 最 令 人 迷惑 的 
也 是 它 的 缓冲 。 

标准 VO 提供 了 以 下 3 种 类 型 的 缓冲 。 

(1) 全 缓冲 。 在 这 种 情况 下 ， 在 填 满 标准 WO 绥 冲 区 后 才 进 行 实 际 
IO 操作 。 对 于 驻 留 在 磁盘 上 的 文件 通常 是 由 标准 MO 库 实 施 全 缓冲 的 。 
在 一 个 流 上 执行 第 一 次 WO 操作 时 ， 相 关 标 准 VO 隐 数 通常 调用 
malloc( 见 7.8 节 ) 获得 需 使 用 的 缓冲 区 。 

术语 冲洗 (flush) 说 明 标 准 1O 缓 冲 区 的 写 操作 。 缓 冲 区 可 由 标准 
IO 例 程 自动 地 冲洗 〈 例 如 ， 当 填 满 一 个 缓冲 区 时 ) ， 或 者 可 以 调用 函 
A fflush 冲洗 一 个 流 。 值 得 注意 的 是 ， 在 UNIX 环 境 中 ，flush 有 两 种 意 
思 。 在 标准 WO 库 方面 ，flush (冲洗 ) 意味 着 将 缓冲 区 中 的 内 容 写 到 磁 
盘 上 【〔 该 缓冲 区 可 能 只 是 部 分 填 满 的 ) 。 在 终端 驱动 程序 方面 (例如 ， 
在 第 18 章 中 所 述 的 tcflush 函 数 ) ，flush ( 刷 清 表示 丢弃 已 存储 在 缓冲 
区 中 的 数据 。 

(2) 行 缓冲 。 在 这 种 情况 下 ， 当 在 输入 和 输出 中 遇 到 换行 符 时 ， 
标准 WO 库 执行 VO 操作 。 这 允许 我 们 一 次 输出 一 个 字符 (用 标准 WO 函数 
fputc) ， 但 只 有 在 写 了 一 行 之 后 才 进 行 实际 IO 操作 。 当 流 涉 及 一 个 终 
端 时 《如 标准 输入 和 标准 输出 ) ， 通 常 使 用 行 缓冲 。 

对 于 行 缓冲 有 两 个 限制 。 第 一 ， 因 为 标准 MO 库 用 来 收集 每 一 行 的 
缓冲 区 的 长 度 是 固定 的 ， 所 以 只 要 填 满 了 缓冲 区 ， 那 么 即使 还 没有 写 一 
个 换行 符 ， 也 进行 IO 操作 。 第 二 ， 任 何 时 候 只 要 通过 标准 IO 库 要 求 从 
(a) 一 个 不 带 缓冲 的 流 ， 或 者 (b) 一 个 行 缓冲 的 流 ( 它 从 内 核 请 求 需 
要 数据 ) 得 到 输入 数据 ， 那 么 就 会 冲洗 所 有 行 缓冲 输出 流 。 在 Cb) 中 
带 了 一 个 在 括号 中 的 说 明 ， 其 理由 是 ， 所 需 的 数据 可 能 已 在 该 缓冲 区 
中 ， 它 并 不 要 求 一 定 从 内 核 读 数据 。 很 明显 ， 从 一 个 不 带 缓冲 的 流 中 输 
入 ( 即 (a) 项 ) 需要 从 内 核 获得 数据 。 

(3) 不 带 缓 冲 。 标 准 MO 库 不 对 字符 进行 缓冲 存储 。 例 如 ， 若 用 标 
准 MO 函 数 fputs 写 15 个 字符 到 不 带 缓冲 的 流 中 ， 我 们 就 期 望 这 15 个 字符 
能 立即 输出 ， 很 可 能 使 用 3.8 节 的 write 函数 将 这 些 字符 写 到 相关 联 的 打 























开 文件 中 。 

标准 错误 流 stderr 通 党 是 不 融 绥 冲 的 ， 这 了 就 使 得 出 错 信息 可 以 尽快 
显示 出 来 ， 而 不 管 它们 是 否 含 有 一 个 换行 符 。 

ISO C 要 求 下 列 绥 冲 特征 。 

“ 当 且 仅 当 标准 输入 和 标准 输出 并 不 指向 交互 式 设 备 时 ， 它 们 才 是 
全 绥 冲 的 。 

“标准 错误 决 不 会 是 全 绥 冲 的 。 

但 是 ， 这 并 没有 告诉 我 们 如 果 标 准 输入 和 标准 输出 指 同 交互 式 设备 
时 ， 它 们 是 不 带 缓 冲 的 还 是 行 缓冲 的 ;以 及 标准 错误 是 不 币 绥 冲 的 还 是 
行 缓冲 的 。 很 多 系统 默认 使 用 下 列 类 型 的 缓冲 : 

“标准 错误 是 不 带 绥 冲 的 。 

* 知 是 指 问 终端 设备 的 流 ， 则 是 行 缓冲 的 ;否则 是 全 缓冲 的 。 

本 书 讨论 的 4 种 平台 都 遵从 标准 IO 缓冲 的 这 些 惯例 ， 标 准 错误 是 不 
带 缓冲 的 ， 打 开 至 终端 设备 的 流 是 行 缓冲 的 ， 其 他 流 是 全 缓冲 的 。 

我 们 将 在 5.12 节 和 图 5-1 对 标准 IO 缓冲 做 更 详细 的 说 明 。 

对 任何 一 个 给 定 的 流 ， 如 果 我 们 并 不 喜欢 这 些 系统 默认 ， 则 可 调用 
下 列 两 个 函数 中 的 一 个 更 改 缓冲 类 型 。 

#include <stdio.h> 

void setbuf(FILE *restrict fp, char *restrict buf); 

int setvbuf(FILE *restrict fp, char *restrict buf, int mode, size_t size); 

返回 值 : ARH, Beo; FEA, eE 

这 些 函 数 一 定 要 在 流 已 被 打开 后 调用 《〈 这 是 十 分 明显 的 ， 因 为 每 个 
函数 都 要 求 一 个 有 效 的 文件 指针 作为 它们 的 第 一 个 参数 ) ， 而 且 也 应 在 
对 该 法 执行 任何 一 个 其 他 操作 之 前 调用 。 

可 以 使 用 setbuf 函数 打开 或 关闭 缓冲 机 制 。 为 了 带 缓冲 进行 IO, 
参数 buf 必 须 指 向 一 个 长 度 为 BUFSIZ 的 缓冲 区 (该 常量 定义 在 <stdio.h> 
H) 。 通 常 在 此 之 后 该 流 就 是 全 绥 冲 的 ， 但 是 如 果 该 流 与 一 个 终端 设备 
相关 ， 那 么 某 些 系统 也 可 将 其 设置 为 行 缓冲 的 。 为 了 关闭 缓冲 ， 将 buf 





设置 为 NULL 。 

使 用 setvbuf， 我 们 可 以 精确 地 说 明 所 需 的 缓冲 类 型 。 这 是 用 mode 参 
数 实现 的 : 

_IOFBF 全 缓冲 


_IOLBE 行 缓冲 

_IONBE Pir 

如 果 指 定 一 个 不 带 缓 冲 的 流 ， 则 忽略 buf 和 size 参 数 。 如 果 指 定 全 组 
冲 或 行 缓冲 ， 则 buf 和 size 可 选择 地 指定 一 个 缓冲 区 及 其 长 度 。 如 果 该 流 
是 带 缓冲 的 ， 而 buf 是 NULL， 则 标准 1O 库 将 自动 地 为 该 流 分 配 适当 长 


度 的 缓冲 区 。 适 当 长 度 指 的 是 由 常量 BUFSIZ 所 指定 的 值 。 
某 些 C 函 数 库 实 现 使 用 stat 结 构 中 的 成 员 st_blksize 所 指定 的 值 〈 见 
决定 最 佳 IO 组 冲 区 长 度 。 在 本 章 的 后 续 内 容 中 可 以 看 到 ，GNU 
函数 库 就 使 用 这 种 方法 。 
图 5-1 列 出 了 这 两 个 函数 的 动作 ， 以 及 它们 的 各 个 选项 。 


HOEK A EW 
hg ia 长 度 为 BUFSI2 的 用 户 缓冲 区 buf | “全 缓冲 或 行 组 冲 
setou 
AME) 


B KEN size 的 用 户 级 神 区 buf 
IOFBF a aT 全 组 冲 
合适 长 度 的 系统 缓冲 区 buf 
setvbuf me KEEN size APSR buf aia 
合适 长 度 的 系统 组 冲 区 buf l 
TIONBF | (AN) (ERME) \ 市 级 ) 


图 5-1 setbuf 和 setvbuf 函 数 

要 了 解 ， 如 果 在 一 个 函数 内 分 配 一 个 自动 变量 类 的 标准 IO 缓冲 

则 从 该 函数 返回 之 前 ， 必 须 关 闭 该 流 (7.8 市 将 对 此 做 更 多 讨 
。 另 外 ， 其 些 实现 将 缓冲 区 的 一 部 分 用 于 存放 它 自 己 的 管理 操作 信 

所 以 可 以 存放 在 缓冲 区 中 的 实际 数据 字 节 数 少 于 size。 一 般 而 言 ， 
应 由 系统 选择 缓冲 区 的 长 度 ， 并 自动 分 配 缓冲 区 。 在 这 种 情况 下 关闭 此 
流 时 ， 标 准 MO 库 将 自动 释放 缓冲 区 。 

任何 时 候 ， 我 们 都 可 强制 冲洗 一 个 流 。 

#include<stdio.h> 

int fflush(FILE *fp); 











返回 值 ， 夺 成功， 返回 0; 奉 出 错 ， 返 回 EOF 
此 函数 使 该 流 所 有 未 写 的 数据 都 被 传送 至 内 核 。 作 为 一 种 特殊 情 
形 ， 如 寿 名 是 NULL， 则 此 函数 将 导致 所 有 输出 流 被 冲洗 。 


5.9 Vii 
下 列 3 个 函数 打开 一 个 标准 IO 流 。 


#include <stdio.h> 
FILE *fopen(const char *restrict pathname, const char *restrict type); 
FILE *freopen(const char *restrict pathname, const char *restrict type, 
FILE *restrict fp); 
FILE *fdopen(int fd, const char *type); 
3 个 函数 的 返回 值 ， 大 成功 ， 返 回 文件 指针 ， 寿 出 错 ， 人 返回 NULL 
这 3 个 函数 的 区 别 如 下 。 

(1) fopen 函 数 打 开路 径 名 为 pathname 的 一 个 指定 的 文件 。 

(2) freopen 函数 在 一 个 指定 的 流 上 打开 一 个 指定 的 文件 ， 如 知 该 
流 已 经 打开 ， 则 先 关 闭 该 流 。 知 该 流 已 经 定 同 ， 则 使 用 freopen 清除 该 
定向 。 此 函数 一 般 用 于 将 一 个 指定 的 文件 打开 为 一 个 预定 义 的 流 : 标准 
输入 、 标 准 输出 或 标准 错误 。 

(3) fdopen 函 数 取 一 个 已 有 的 文件 捅 述 符 (我 们 可 能 从 open、 
dup、dup2、fcntl、Ppipe、socket、socketpair 或 accept 函 数 得 到 此 文件 描 
述 符 ) ， 并 使 一 个 标准 的 MO 流 与 该 描述 符 相 结合 。 此 函数 常用 于 由 创 
建 管道 和 网 络 通信 通道 施 数 返 回 的 描述 符 。 因 为 这 些 特 殊 类 型 的 文件 不 
能 用 标准 WO 函数 fopen 打 开 ， 所 以 我 们 必须 先 调 用 设备 专用 函数 以 获得 
一 个 文件 描述 符 ， 然 后 用 fdopen 使 一 个 标准 IO 流 与 该 描述 符 相 结合 。 

fopen 和 freopen 是 ISO “C 的 所 属 部 分 。 而 ISO ”CC 并 不 涉及 文件 描述 
符 ， 所 以 仅 有 POSIX.1 具 有 fdopen。 

type 参 数 指定 对 该 1/O 流 的 恋 、 写 方式 ，ISO “C 规 定 type 参 数 可 以 有 
15 种 不 同 的 值 ， 如 图 5-2 所 示 。 





r fi rb 为 读 而 打开 0 RDONLY 
Ww 或 wb 把 文件 截断 至 0 长， 或 为 写 而 创建 0 WRONLY|O CREAT |O TRUNC 


a 或 ab 追加 ， 为 在 文件 尾 写 而 打开 ， 或 为 写 而 创建 | 0_WRONLY|O_CREAT|O_APPEND 
rt 或 rtb 或 rb+ | 为 读 和 写 而 打开 O_RDWR 

wtih wtb 或 wb+ | 把 文件 截断 至 0 长， 或 为 恋 和 写 而 打开 O_RDWR |0_CREAT |O_ TRUNC 
ai 或 atb 或 ab+ | 为 在 文件 尾 读 和 写 而 打开 或 创建 0 RDWR|O_CREAT|0 APPEND 








图 5-2 打开 标准 IO 流 的 type 参 数 

使 用 字符 b 作 为 type 的 一 部 分 ， 这 使 得 标准 MO 系统 可 以 区 分 文本 文 
件 和 二 进 制 文件 。 因 为 UNIX 内 核 并 不 对 这 两 种 文件 进行 区 分 ， 所 以 在 
UNIX 系 统 环境 下 指定 字符 b 作 为 type 的 一 部 分 实际 上 并 无 作用 。 

对 于 fdopen，type 参 数 的 意义 各 有 区 别 。 因 为 该 描述 符 已 被 打开 ， 
所 以 fdopen 为 写 而 打开 并 不 截断 该 文件 。《〈 例 如 ， 知 该 描述 符 原 来 是 由 
open 国 数 创 建 的 ， 而 且 该 文件 已 经 存在 ， 则 其 O_TRUNC 标 志 将 决定 是 
售 截 断 该 文件 。fdopen 函 数 不 能 截断 它 为 写 而 打开 的 任 一 文件 。) A 
外 ， 标 准 IO 妃 加 写 方式 也 不 能 用 于 创建 该 文件 〈 因 为 如 果 一 个 描述 符 
引用 一 个 文件 ， 则 该 文件 一 定 已 经 存在 ) 。 

当 用 追加 写 类 型 打开 一 个 文件 后 ， 每 次 写 都 将 数据 写 到 文件 的 当前 
尾 端 处 。 如 果 有 多 个 进程 用 标准 WO 追加 写 方式 打开 同一 文件 ， 那 么 来 
自 每 个 进程 的 数据 都 将 正确 地 写 到 文件 中 。 

4.4BSD 以 前 的 伯克利 版 本 以 及 Kernighan 和 Ritchie[1988] 第 177 页 
上 所 示 的 简单 版 本 的 fopen 函数 并 不 能 正确 地 处 理 妃 加 写 方 式 。 这 些 版 
本 在 打开 流 时 ， 调 用 ]seek 定 位 到 文件 尾 端 。 在 涉及 多 个 进程 时 ， 为 了 下 
确 地 支持 奶 加 写 方式 ， 该 文件 必须 用 O_APPEND 标 志 打 开 ， 我 们 已 在 
3.3 节 中 对 此 进行 了 讨论 。 在 每 次 写 前 ， 做 一 次 lseek 操 作 同 样 也 不 能 
确 工 作 《〈 如 同 在 3.11 节 中 讨论 的 一 样 ) 。 

当 以 读 和 写 类 型 打开 一 个 文件 时 〈type 中 + 号 ) ， 具 有 下 列 限 制 。 

。 如 果 中 间 没 有 fflush、fseek、fsetpos 或 rewind， 则 在 输出 的 后 面 不 
能 直接 跟随 输入 。 

“如果 中 间 没 有 fseek、fsetpos 或 rewind， 或 者 一 个 输入 操作 没有 到 达 
文件 尾 端 ， 则 在 输入 操作 之 后 不 能 直接 跟随 输出 。 

对 应 于 图 5-2， 图 5-3 中 列 出 了 打开 一 个 流 的 6 种 不 同 的 方式 。 








文件 必须 已 存在 
放弃 文件 以 前 的 内 容 


流 可 以 读 
流 可 以 写 
流 只 可 在 尾 端 处 写 








图 5-3 打开 一 个 标准 MO 流 的 6 种 不 同方 式 

注意 ， 在 指定 Ww 或 a 类 型 创建 一 个 新 文件 时 ， 我 们 无 法 说 明 该 文件 的 
访问 权限 位 (第 3 章 中 所 述 的 open 函 数 和 creat 函 数 则 能 做 到 这 一 点 )〉。 
POSIX.1 要 求实 现 使 用 如 下 的 权限 位 集 来 创建 文件 : 

S_IRUSR | S_IWUSR | S_IRGRP | S_IWGRP | S_IROTH | S_IWOTH 

回忆 4.8 节 ， 我 们 可 以 通过 调整 umask 值 来 限制 这 些 权 限 。 

除非 流 引 用 终端 设备 ， 否 则 按 系 统 默认 ， 流 被 打开 时 是 全 绥 冲 的 。 
在 流 引 用 终端 设备 ， 则 访 流 是 行 缓冲 的 。 一 旦 打开 了 流 ， 那 么 在 对 该 流 
执行 任何 操作 之 前 ， 如 果 和 希望 ， 则 可 使 用 前 节 所 述 的 setbuf 和 setvbuf 改 
变 缓冲 的 类 型 。 

调用 fclose 关 闭 一 个 打开 的 流 。 

#include <stdio.h> 

int fclose(FILE *fp); 

返回 值 : 知 成 功 ， 返 回 0;， 奋 出错， 返回 EOF 

在 该 文件 被 关闭 之 前 ， 冲 洗 缓 冲 中 的 输出 数据 。 绥 冲 区 中 的 任何 输 
入 数据 被 丢弃 。 如 果 标 准 1/O 库 已 经 为 该 流 自动 分 配 了 一 个 缓冲 区 ， 则 
释放 此 缓冲 区 。 

当 一 个 进程 正常 终止 时 〈 直 接 调 用 exit 函 数 ， 或 从 main 函 数 返 
ED ， 则 所 有 带 未 写 缓冲 数据 的 标准 IO 流 都 被 冲洗 ， 所 有 打开 的 标准 
IO 流 都 被 关闭 。 


5.6 谈 和 与 济 


一 旦 打开 了 流 ， 则 可 在 3 种 不 同类 型 的 非 格式 化 VO 中 进行 选择 ， 对 
其 进行 读 、 写 操作 。 

(1) 每 次 一 个 字符 的 VO。 一 次 读 或 写 一 个 字符 ， 如 果 流 是 带 绥 冲 
的 ， 则 标准 MO 函数 处 理 所 有 缓冲。 

(2) 每 次 一 行 的 HO。 如 果 想 要 一 次 读 或 写 一 行 ， 则 使 用 fgets 和 
fputs。 每 行 都 以 一 个 换行 符 终止 。 当 调用 fgets 时 ， 应 说 明 能 处 理 的 最 大 
行 长 。5.7 节 将 说 明 这 两 个 函数 。 

(3) 直接 IO。fread 和 fwrite 函 数 文 持 这 种 类 型 的 HO。 每 次 votè 
作 读 或 写 某 种 数量 的 对 象 ， 而 每 个 对 象 具 有 指定 的 长 度 。 这 两 个 函数 党 
用 于 从 二 进 制 文件 中 每 次 读 或 写 一 个 结构 。5.9 市 将 说 明 这 两 个 函数 。 

直接 WO (direct VO) 这 个 术语 来 自 ISO C 标 准 ， 有 时 也 被 称 为 : 二 
进 制 WO、 一 次 一 个 对 象 /O、 面 同 记录 的 VO 或 面向 结构 的 LO。 不 要 把 
这 个 特性 和 FreeBSD 和 Linux 支 持 的 open 函 数 的 O_DIRECT 标 志 混 淆 ， 它 
们 之 间 是 没有 关系 的 。 

(5.11 市 说 明了 格式 化 VO 函数 ， 如 printf 和 scanf。) 

1. 输入 函数 

以 下 3 个 函数 可 用 于 一 次 读 一 个 字符 。 

#include <stdio.h> 

int getc(FILE *fp); 

int fgetc(FILE *fp); 

int getchar(void); 

3 个 函数 的 返回 值 : A, WRI) RPE A BTA CE Emek h 
错 ， 返 回 EOF 
函数 getchar 等 同 于 getc(stdin)。 前 两 个 函数 的 区 别 是 ，getc 可 被 实现 
为 宏 ， 而 fgetc 不 能 实现 为 宏 。 这 意味 着 以 下 几 点 。 
e D getc 的 参数 不 应 当 是 具有 副作用 的 表达 式 ， 因 为 它 可 能 会 被 计 
Vaz. 1X 

(2) 因为 fgetc 一 定 是 个 函数 ， 所 以 可 以 得 到 其 地 址 。 这 就 允许 将 
fgetc 的 地 址 作为 一 个 参数 传送 给 男 一 个 函数 。 

(3) 调用 fgetc 所 需 时 间 很 可 能 比 调用 getc 要 长 ， 因 为 调用 函数 所 需 
的 时 间 通 常 长 于 调用 宏 。 

这 3 个 函数 在 返回 下 一 个 字符 时 ， 将 其 unsigned char 类 型 转换 为 int 类 


























型 。 说 明 为 无 符号 的 理由 是 ， 如 果 最 高 位 为 1 也 不 会 使 返回 值 为 负 。 要 
求 整 型 返回 值 的 理由 是 ， 这 样 就 可 以 返回 所 有 可 能 的 字符 值 再 加 上 一 个 
己 出 错 或 已 到 达 文 件 尾 端 的 指示 值 。 在 <stdio.h> 中 的 常量 EOF 被 要 求 是 
一 个 负 值 ， 其 值 经 常 是 -1。 这 就 意味 着 不 能 将 这 3 个 函数 的 返回 值 存 放 
在 一 个 字符 变量 中 ， 以 后 还 要 将 这 些 函 数 的 返回 值 与 常量 EOF 比 较 。 

注意 ， 不 管 是 出 错 还 是 到 达 文 件 尾 端 ， 这 3 个 函数 都 返回 同样 的 
值 。 为 了 区 分 这 两 种 不 同 的 情况 ， 必 须 调用 ferror 或 feof。 

#include <stdio.h> 

int ferror(FILE *fp); 

int feof(FILE *fp); 

两 个 函数 返回 值 : ERFAR, Beo CW; 人 否则， 返回 0《〈 假 ) 

void clearerr(FILE *fp); 

在 大 多 数 实现 中 ， 为 每 个 流 在 FILE 对 象 中 维护 了 两 个 标志 : 











"出 错 标 志 ; 
"文件 结束 标志 。 


调用 clearerr 可 以 清除 这 两 个 标志 。 

从 流 中 读 取 数据 以 后 ， 可 以 调用 ungetc 将 字符 再 压 送 回流 中 。 

#include <stdio.h> 

int ungetc(int c, FILE *fp); 

返回 值 : 知 成 功 ， 返 回 c; AHH, JKIFIEOF 

压 送 回 到 流 中 的 字符 以 后 又 可 从 流 中 读 出 ， 但 读 出 字符 的 顺序 与 压 
送 回 的 顺序 相反 。 应 当 了 解 ， 虽 然 ISO ” C 人 允许 实现 支持 任何 次 数 的 回 
送 ， 但 是 它 要 求实 现 提 供 一 次 只 回 送 一 个 字符 。 我 们 不 能 期 望 一 次 能 
送 多 个 字符 。 

回 送 的 字符 ， 不 一 定 必 须 是 上 一 次 读 到 的 字符 。 不 能 回 送 EOF。 但 
是 当 已 经 到 达 文 件 尾 端 时 ， 仍 可 以 回 送 一 个 字符 。 下 次 读 将 返回 该 字 
符 ， 再 读 则 返回 EOF。 之 所 以 能 这 样 做 的 原因 是 ， 一 次 成 功 的 ungetc 调 
用 会 清除 该 流 的 文件 结束 标志 。 

当 正 在 读 一 个 输入 流 ， 并 进行 某 种 形式 的 切 词 或 记号 切 分 操作 时 ， 
会 经 常用 到 回 送 字 符 操 作 。 有 了 时 需要 先 看 一 看 下 一 个 字符 ， 以 决定 如 何 
处 理 当 前 字符 。 然 后 承 需 要 方便 地 将 刚 碍 看 的 字符 回 送 ， 以 便 下 一 次 调 
用 getc 时 返回 该 字符 。 如 果 标 准 IMO 库 不 提供 回 送 能 力 ， 就 需 将 该 字符 存 
放 到 一 个 我 们 目 己 的 变量 中 ， 并 设置 一 个 标志 以 便 判别 在 下 一 次 需要 一 
个 字符 时 是 调用 getc， 还 是 从 我 们 自己 的 变量 中 取 用 这 个 字符 。 

用 ungetc 压 送 回 字符 时 ， 并 没有 将 它们 写 到 底层 文件 中 或 设备 上 ， 
只 是 将 它们 写 回 标准 1O 库 的 流 缓 冲 区 中 。 

2. 输出 函数 

















对 应 于 上 面 所 述 的 每 个 输入 函数 都 有 一 个 输出 函数 。 
#include <stdio.h> 
int putc(int c, FILE *fp); 
int fputc(int c, FILE *fp); 
int putchar(int c); 
3 个 函数 返回 值 ， 奎 成功， 返回 c; 寿 出 错 ， 返 回 EOF 
与 输入 函数 一 样 ，putchar(c) 等 同 于 putc(c， stdout)，putc 可 被 实现 为 
宏 ， 而 fputc 不 能 实现 为 宏 。 


5.7 每 次 一 行 IO 


下 面 两 个 函数 提供 每 次 输入 一 行 的 功能 。 

#include <stdio.h> 

char *fgets(char *restrict buf, intn, FILE *restrict fp); 

char *gets(char *buf); 

两 个 函数 返回 值 : ERJ, wlelbufs 知已 到 达 文 件 尾 端 或 出 错 ， 返 回 
NULL 

这 两 个 函数 都 指定 了 缓冲 区 的 地 址 ， 读 入 的 行将 送 入 其 中 。gets 从 
标准 输入 读 ， 而 fgets 则 从 指定 的 流 读 。 

对 于 fgets， 必 须 指定 缓冲 的 长 度 n。 此 函数 一 直 读 到 下 一 个 换行 符 
为 止 ， 但 是 不 超过 n 1 个 字符 ， 读 入 的 字符 被 送 入 缓冲 区 。 该 缓冲 区 以 
null 字 节 结 尾 。 如 奉 该 行 包括 最 后 一 个 换行 符 的 字符 数 超过 n 1， 则 fgets 
只 返回 一 个 不 完整 的 行 ， 但 是 ， 绥 冲 区 总 是 以 null 字 市 结尾 。 对 fgets 的 
下 一 次 调用 会 继续 读 该 行 。 

gets 是 一 个 不 推荐 使 用 的 函数 。 其 问题 是 调用 者 在 使 用 gets 时 不 能 
指定 缓冲 区 的 长 度 。 这 样 就 可 能 造成 缓冲 区 洲 出 〈 如 大 该 行 长 于 缓冲 区 
KE) ， 写 到 缓冲 区 之 后 的 存储 空间 中 ， 从 而 产生 不 可 预料 的 后 末 。 这 
种 缺陷 曾 被 利用 ， 造 成 1988 年 的 因特网 肾 虫 事件 。 有 关 说 明 请 见 1989 年 
6 月 的 Communications of the ACM (vol.32,no.6) 。gets 与 fgets 的 另 一 个 
区 别 是 ，gets 并 不 将 换行 符 存 入 绥 冲 区 中 。 

这 两 个 函数 对 换行 符 处 理 方式 的 差别 与 UNIX 的 进展 有 关 。 在 V7 的 
手册 (1979) 中 就 说 明 :“ 为 了 回 后 兼容 ，gets 删 除 换行 符 ， 而 fgets 则 保 
留 换行 符 。” 

虽然 TO  C 要 求 提 供 gets， 但 请 使 用 fgets， 而 不 要 使 用 gets。 事 实 
上 ， 在 SUSv4 中 ， gets 被 标记 为 弃 用 的 接口 ， 而 且 在 ISO C 标 准 的 最 新 
版 本 (ISO/IEC 9899:2011) 中 已 被 忽略 。 

fputs 和 puts 提 供 每 次 输出 一 行 的 功能 。 

#include <stdio.h> 

int fputs(const char *restrict str, FILE *restrict fp); 

int puts(const char *str); 

两 个 函数 返回 值 : ARJ, REJER; FRE, iKIE|EOF 

函数 fputs 将 一 个 以 null 字 市 终止 的 字符 串 写 到 指定 的 流 ， 尾 端的 终 
止 符 null 不 写 出 。 注 意 ， 这 并 不 一 定 是 每 次 输出 一 行 ， 因 为 字符 串 不 需 








要 换行 符 作为 最 后 一 个 非 null 字 节 。 通 常 ， 在 null 字 节 之 前 是 一 个 换行 
符 ， 但 并 不 要 求 总 是 如 此 。 

puts 将 一 个 以 nul 字 节 终 止 的 字符 串 写 到 标准 输出 ， 终 止 符 不 写 
出 。 但 是 ，puts 随 后 又 将 一 个 换行 符 写 到 标准 输出 。 

puts 并 不 像 它 所 对 应 的 gets 那样 不 安全 。 但 是 我 们 还 是 应 避免 使 用 
它 ， 以 免 需要 记 住 它 在 最 后 是 否 添加 了 一 个 换行 符 。 如 果 总 是 使 用 fgets 


和 fputs, 那么 就 会 熟知 在 每 行 终止 处 我 们 必须 目 己 处 理 换行 符 。 








5.8 PEIOR RICX 


使 用 前 面 所 述 的 函数 ， 我 们 能 对 标准 MO 系统 的 效率 有 所 了 解 。 图 5- 
4 程序 类 似 于 图 3-4 程 序 ， 它 使 用 getc 和 putc 将 标准 输入 复制 到 标准 输 
出 。 这 两 个 例 程 可 以 实现 为 宏 。 


tinclude "apue.h" 


int 
main (void) 
| 


int A 


while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 


err sys("output error"); 


if (ferror (stdin) ) 


err sys("input error"); 


exit(0); 


图 5-4 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 

可 以 用 fgetc 和 fputc 改 号 该 程序 ， 这 两 个 一 定 是 函数 ， 而 不 是 宏 〈 我 
们 没有 给 出 对 源 代 码 更 改 的 细节 ) 。 

最 后 ， 我 们 还 编写 了 一 个 读 、 写 行 的 版 本 ， 见 图 5-5。 


finclude "apue.h" 


int 
main (void) 
| 
char buf {MAXLINE]; 


while (fgets(buf, MAXLINE, stdin) != NULL) 
if (fputs(buf, stdout) == EOF) 


err sys("output error"); 


if (ferror (stdin) ) 
err sys("input error"); 


exit (0); 


图 5-5 用 fgets 和 fputs 将 标准 输入 复制 到 标准 输出 

注意 ， 在 图 5-4 程 序 和 图 5-5 程 序 中 ， 没 有 显 式 地 关闭 标准 IJO 流 。 我 
们 知道 exit 函 数 将 会 冲洗 任何 未 写 的 数据 ， 然 后 关闭 所 有 打开 的 流 〈 我 
们 将 在 8.5 节 讨论 这 一 点 ) 。 将 这 3 个 程序 的 时 间 与 图 3-6 中 的 时 间 进 行 比 
较 是 很 有 趣 的 。 图 5-6 中 显示 了 对 同一 文件 (98.5 MB，300 万 行 ) 进行 
操作 所 得 的 数据 。 


用 户 CPU (s) | 系统 CPU (s) | 时 钟 时 间 (s) | 程序 正文 字 节 数 


图 3-6 中 的 最 佳 时 间 
fgets, fputs 
getc, putc 
fgetc, fputc 


图 3-6 中 的 音字 池 时 间 











图 5-6 使 用 标准 IO 例 程 得 到 的 时 间 结 果 

对 于 这 3 个 标准 MO 版 本 的 每 一 个 ， 其 用 户 CPU 时 间 都 大 于 图 3-6 中 的 
最 佳 read 版 本 ， 因 为 在 每 次 读 一 个 字符 的 标准 WO 版 本 中 有 一 个 要 执行 1 
亿 次 的 循环 ， 而 在 每 次 读 一 行 的 版 本 中 有 一 个 要 执行 3 144 984 次 的 循 
环 。 在 read 版 本 中 ， 其 循环 只 需 执 行 25 224 次 〈 对 于 缓冲 区 长 度 为 4 096 
字 节 ) 。 因 为 系统 CPU 时 间 几 乎 相同 ， 所 以 用 户 CPU 时 间 的 差别 以 及 等 
待 IO 结 束 所 消耗 时 间 的 差别 造成 了 时 钟 时 间 的 差别 。 

系统 CPU 时 间 几 乎 相同 ， 原 因 是 因为 所 有 这 些 程序 对 内 核 提出 的 
读 、 写 请 求 数 基本 相同 。 注 意 ， 使 用 标准 1O 例 程 的 一 个 优点 是 无 需 考 
虑 缓冲 及 最 佳 IO 长 度 的 选择 。 在 使 用 fgets 时 需要 考虑 最 大 行 长 ， 但 是 
与 选择 最 佳 IO 长 度 比 较 ， 这 要 方便 得 多 。 

图 5-6 的 最 后 一 列 是 每 个 main 函 数 的 文本 空间 字 节 数 〈 由 C 编 译 器 产 
生 的 机 器 指令 ) 。 从 中 可 见 ， 使 用 getc 和 putc 的 版 本 与 使 用 fgetc 和 fputc 
的 版 本 在 文本 空间 长 度 方面 大 体 相 同 。 通 常 ，getc 和 putc 实 现 为 宏 ， 但 
在 GNU C 库 实现 中 ， 宏 简单 地 扩充 为 函数 调用 。 

使 用 每 次 一 行 WO 版 本 的 速度 大 约 是 每 次 一 个 字符 版 本 速度 的 两 
倍 。 如 果 fgets 和 fputs 函 数 是 用 getc 和 putc 实 现 的 (参见 Kernighan 和 
Ritchie[1988] 的 7.7 节 ) ， 那 么 ， 可 以 预期 fgets 版 本 的 时 间 会 与 getc 版 本 
接近 。 实 际 上 ， 每 次 一 行 的 版 本 会 更 慢 一 些 ， 因 为 除了 现 已 存在 的 6 百 
万 次 函数 调用 外 还 需 男 外 增加 2 亿 次 函数 调用 。 而 在 本 测试 中 所 用 的 每 
次 一 行 冰 数 是 用 memccpy(3) 实 现 的。 通常 ， 为 了 提高 效 紊 ，memccpy 子 
a ieernate 
TRIS o 

这 些 时 间 数 字 的 最 后 一 个 有 趣 之 处 在 于 : fgetc 版 本 较 图 3-6 中 
BUFFSIZE 王 1 的 版 本 要 快 得 多 。 两 者 都 使 用 了 约 2 亿 次 的 函数 调用 ， 在 
用 户 CPU 时 间 方 面 ，fgetc 版 本 的 速度 大 约 是 后 者 的 16 倍 ， 而 在 时 钟 时 间 






































方面 几乎 是 39 倍 。 造 成 这 种 差别 的 原因 是 : 使 用 read 的 版 本 执行 了 2 亿 
次 函数 调用 ， 这 也 就 引起 2 亿 次 系统 调用 。 而 对 于 fgetc 版 本 ， 它 也 执行 2 
亿 次 函数 调用 ， 但 是 这 只 引起 25 224 次 系统 调用 。 系 统 调用 与 普通 的 函 
数 调用 相 比 需要 花费 更 多 的 时 间 。 

需要 声明 的 是 ， 这 些 时 间 结 果 只 在 某 些 系 统 上 才 有 效 。 这 种 时 间 结 
果 依 赖 于 很 多 实现 的 特征 ， 而 这 种 特征 对 于 不 同 的 UNIX 系 统 可 能 是 不 
同 的 。 尽 管 如 此 ， 有 这 样 一 组 数据 ， 并 对 各 种 版 本 的 差别 做 出 解释 ， 这 
有 助 于 我 们 更 好 地 了 解 系统 。 在 本 节 及 3.9 节 中 我 们 了 解 到 的 基本 事实 
是 ， 标 准 IO 库 与 直接 调用 read 和 write 函数 相 比 并 不 慢 很 多 。 对 于 大 多 数 
比较 复杂 的 应 用 程序 ， 最 主要 的 用 户 CPU 时 间 是 由 应 用 本 喘 的 各 种 处 理 
消耗 的 ， 而 不 是 由 标准 IO 例 程 消耗 的 。 





5.9 一 进 制 IO 


5.6 节 和 5.7 节 中 的 函数 以 一 次 一 个 字符 或 一 次 一 行 的 方式 进行 操 
fE. 如 果 进 行 二 进 制 1O 操 作 ， 那 么 我 们 更 愿意 一 次 读 或 写 一 个 完整 的 
结构 。 如 果 使 用 getc 或 putc 读 、 写 写 一 个 结构 ， 那 么 必须 循环 通过 整个 结 
构 ， 每 次 循环 处 理 “ae Ea ap ’ 次 读 或 写 一 个 字 节 ’ 这 会 非常 抹 烦 而 且 
费时 。 如 果 使 用 fputs 和 fgets， 那么 因为 fputs 在 遇 到 null 字 节 时 就 停止 
而 在 结构 中 可 能 含有 null 字 节 ， 所 以 不 能 使 用 它 实 现 读 结 构 的 要 求 。 相 
类 似 ， 如 果 输入 数据 中 包含 有 nul 字 节 或 换行 符 ， 则 fgets 也 不 能 正确 工 
作 。 因 此 ， 提 供 了 下 列 两 个 函数 以 执行 二 进 制 VO 操 作 。 

#include <stdio.h> 

size_t fread(void *restrict ptr, size_t size, size_t nobj, FILE *restrict fp); 

size_t fwrite(const void *restrict ptr, size_t size, size_t nobj, FILE 


*restrict fp); 
两 个 函数 的 返回 值 : 读 或 写 的 对 象 数 
些 函 数 有 以 下 两 种 常见 的 用 法 。 
(1) 读 或 写 一 个 二 进 制 数组 。 例 如 ， 为 了 将 一 个 浮 点 数组 的 第 2 
一 5 个 元 素 写 至 一 文件 上 ， 可 以 编写 如 下 程序 : 
float data[10]; 
if (fwrite(&data[2], sizeof(float), 4, fp) != 4) 
err_sys("fwrite error"); 
AR, daxesize NRE TBA UR ITS EE, nobj a 次 写 的 元 素 个 数 。 
2) 读 或 写 一 个 吉 构 。 例 如 ， 可 以 编写 如 下 程序 : 























struct { 

short count; 

long total; 

char name| NAMESIZE]; 
} item; 


if (fwrite(&item, sizeof(item), 1, fp) != 1) 
err IOl iiie error"); 
其 中 ， 指 定 size 为 结构 的 长 度 ，nobj 为 1〈 要 写 的 对 象 个 数 ) 。 
将 这 两 个 例子 结合 起 来 就 可 读 或 写 一 个 结构 数组 。 为 了 做 到 这 
mi, size 应 当 是 该 结构 的 sizeof，nobj 应 是 该 数组 中 的 元 素 个 数 。 
fread 和 fwrite 返 回 读 或 写 的 对 象 数 。 对 于 读 ， 如 果 出 错 或 到 达 文 件 


尾 端 ， 则 此 数字 可 以 少 于 nobj。 在 这 种 情况 ， 应 调用 ferror 或 feof 以 判断 
完 竟 是 那 一 种 情况 。 对 于 写 ， 如 果 返 回 值 少 于 所 要 求 的 nobj， 则 出 错 。 
使 用 二 进 制 VO 的 基本 问题 是 ， 它 只 能 用 于 读 在 同一 系统 上 已 写 的 

数据 。 多 年 之 前 ， 这 并 无 问题 〈( 那 时 ， 所 有 UNIX 系 统 都 运行 于 PDP-11 
上 ) ， 而 现在 ， 很 多 异 构 系统 通过 网 络 相 互 连 接 起 来 ， 而 且 ， 这 种 情况 
己 经 非常 普 裔 。 常 常 有 这 种 情形 ， 在 一 个 系统 上 写 的 数据 ， 要 在 男 一 个 
人 在 这 种 环境 下 ， 这 两 个 函数 可 能 就 不 能 正常 工作 ， 其 
原因 是 : 

(1) 在 一 个 结构 中 ， 同 一 成 员 的 偏 移 量 可 能 随 编译 程序 和 系统 的 
不 同 而 不 同 〈 由 于 不 同 的 对 齐 要 求 ) 。 确 实 ， 某 些 编译 程序 有 一 个 选 
项 ， 选 择 它 的 不 同 值 ， 或 者 使 结构 中 的 各 成 员 紧 密 包 装 〈 这 可 以 节省 存 
储 空 间 ， 而 运行 性 能 则 可 能 有 所 下 降 ) ; 或 者 准确 对 齐 〈 以 便 在 运行 时 
易于 存 取 结构 中 的 各 成 员 ) 。 这 意味 着 即使 在 同一 个 系统 上 ， 一 个 结构 
的 二 进 制 存放 方式 也 可 能 因 编 译 程序 选项 的 不 同 而 不 同 。 

(2) 用 来 存储 多 字 节 整数 和 浮 点 值 的 二 进 制 格式 在 不 同 的 系统 结 
构 间 也 可 能 不 同 。 

在 第 16 章 讨论 套 接 字 时 ， 我 们 将 涉及 某 些 相关 问题 。 在 不 同系 统 
之 间 交 换 二 进 制 数 据 的 实际 解决 方法 是 使 用 互 认 的 规范 格式 。 关 于 网 络 
协议 使 用 的 交换 二 进 制 数据 的 某 些 技术 ， 请 参阅 Rogo[1993] 的 8.2 市 或 者 
Stevens、Fenner 和 Rudoff[2004] 的 5.18 闻 。 

在 8.14 节 中 ， 我 们 将 再 回 到 fread 函数 ， 那 时 将 用 它 读 一 个 二 进 制 
结构 一 一 UNIX 的 进程 会 计 记 录 。 


















































5.10 定位 流 


有 3 种 方法 定位 标准 IO 流 。 
(1) ftell 和 fseek 函数 。 这 两 个 函数 自 V7 DORMS, (AE 
们 都 假定 文件 的 位 置 可 以 存放 在 一 个 长 整 型 中 。 
(2) ftello#fllfseekorki 2. Single UNIX Specifications] A J iX PA eI 
数 ， 使 文件 偏 移 量 可 以 不 必 一 定 使 用 长 整 型 。 它 们 使 用 off 数据 类 型 代 
SRA. 
(3) fgetpos 和 fsetpos 函 数 。 这 两 个 函数 是 由 ISO C 引 入 的 。 它 们 使 
用 一 个 抽象 数据 类 型 fpos_t 记 录 文 件 的 位 置 。 这 种 数据 类 型 可 以 根据 需 
要 定义 为 一 个 足够 大 的 数 ， 用 以 记录 文件 位 置 。 
需要 移植 到 非 UNIX 系 统 上 运行 的 应 用 程序 应 当 使 用 fgetpos 和 
fsetpos。 
#include <stdio.h> 
long ftell(FILE *fp); 
返回 值 : ARJ, RES iets; 大 出 错 ， 返 回 -1L 
int fseek(FILE *fp, long offset, int whence); 
返回 值 : ERJ, EO; Et, eE- 
void rewind(FILE *fp); 


对 于 一 个 二 进 制 文件 ， 其 文件 位 置 指示 器 是 从 文件 起 始 位置 开 始 度 
量 ， 并 以 字 节 为 度量 单位 的 。ftell 用 于 二 进 制 文件 时 ， 其 返回 值 就 是 这 
种 字 节 位 置 。 为 了 用 fseek 定 位 一 个 二 进 制 文件 ， 必 须 指 定 一 个 字 节 
offset， 以 及 解释 这 种 偏 移 量 的 方式 。whence 的 值 与 3.6 节 中 ]seek 函 数 的 
相同 : SEEK_SET 表 示 从 文件 的 起 始 位 置 开 始 ，SEEK_CUR 表 示 从 当前 
文件 位 置 开始 ，SEEK_END 表 示 从 文件 的 尾 端 开始 。ISO C 并 不 要 求 一 
个 实现 对 二 进 制 文件 支持 SEEK_END 规 格 说 明 ， 其 原因 是 某 些 系统 要 求 
二 进 制 文件 的 长 度 是 某 个 约 数 的 整数 倍 ， 结 尾 非 实际 内 容 部 分 则 填充 为 
0。 但 是 在 UNIX 中 ， 对 于 二 进 制 文 件 ， 则 是 支持 SEEK_END 的 。 

对 于 文本 文件 ， 它 们 的 文件 当前 位 置 可 能 不 以 简单 的 字 节 偏 移 量 来 
度量 。 这 主要 也 是 在 非 UNIX 系 统 中 ， 它 们 可 能 以 不 同 的 格式 存放 文本 
文件 。 为 了 定位 一 个 文本 文件 ，whence 一 定 要 是 SEEK_SET， 而 有 offset 
只 能 有 两 种 值 ，0 (后退 到 文件 的 起 始 位 置 ) ， 或 是 对 该 文件 的 ftell 所 返 
回 的 值 。 使 用 rewind 函 数 也 可 将 一 个 流 设 置 到 文件 的 起 始 位 置 。 

除了 偏 移 量 的 类 型 是 off_{t 而 非 long 以 外 ，ftello 函 数 与 ftell 相 同 ， 




















fseeko 函 数 与 fseek 相 同 。 
#include <stdio.h> 
off_t ftello(FILE *fp); 
返回 值 : RD), ESRC, Aisa, JK Il(off_t)-1 
int fseeko(FILE *fp, off_t offset, int whence); 
返回 值 : ERJ, EO; AR, eE- 
回忆 3.6 节 中 对 off_t 数 据 类 型 的 讨论 。 实 现 可 将 off_t 类 型 定义 为 长 于 
Ble 
正如 我 们 已 提 及 的 ，fgetpos 和 fsetpos 两 个 函数 是 ISO C 标 准 引 入 
的 。 
#include <stdio.h> 
int fgetpos(FILE *restrict fp, fpos_t *restrict pos); 
int fsetpos(FILE *fp, const fpos_t *pos); 
两 个 函数 返回 值 : ARJ, Beo; FE, eE 
fgetpos 将 文件 位 置 指示 器 的 当前 值 存 入 由 pos 指 辣 的 对 象 中 。 在 以 
后 调用 fsetpos 时 ， 可 以 使 用 此 值 将 流 重 新 定位 至 该 位 置 。 








5.11 化 LO 


1. 格式 化 输出 
格式 化 输出 是 由 5 个 printf 函 数 来 处 理 的 。 
#include <stdio.h> 
int printf(const char *restrict format, ...); 
int fprintf(FILE *restrict fp, const char *restrict format, ...); 
int dprintf(int fd, const char *restrict format, ...); 
3 个 函数 返回 值 ， 唇 成功， 返回 输出 字符 数 ， 夺 输出 出 错 ， 返 回 负 值 
int sprintf(char *restrict buf, const char *restrict format, ...); 
返回 值 : ERJ, ARAN: Se, WIE) EL 
int snprintf(char *restrict buf, size_t n, const char *restrict format, ...); 
返回 值 : Ae X AWK, WABASH t, 
返回 负 值 
printf 将 格式 化 数据 写 到 标准 输出 ，fprintf 写 至 指定 的 流 ，dprintf 写 
至 指定 的 文件 描述 符 ，sprintf 将 格式 化 的 字符 送 入 数组 buf 中 。sprintf 在 
该 数组 的 尾 端 自动 加 一 个 null 字 市 ， 但 该 字符 不 包括 在 返回 值 中 。 
注意 ，sprintf 函 数 可 能 会 造成 由 buf 指 向 的 缓冲 区 的 溢出 。 调 用 者 有 
责任 确保 该 缓冲 区 足够 大 。 因 为 缓冲 区 洲 出 会 造成 程序 不 稳定 其 至 安全 
隐患 ， 为 了 解决 这 种 缓冲 区 溢出 问题 ， 引 入 了 snprintf 函 数 。 在 该 函数 
中 ， 绥 冲 区 长 度 是 一 个 显 式 参数 ， 超 过 缓冲 区 尾 问 写 的 所 有 字符 都 被 丢 
弃 。 如 果 绥 冲 区 足够 大 ，snprintf 疯 数 就 会 返回 写 入 缓冲 区 的 字符 数 。 与 
sprintf 相 同 ， 该 返回 值 不 包括 结尾 的 null 字 节 。 知 Snprintf 函 数 返 回 小 于 
缓冲 区 长 度 n 的 正 值 ， 那 么 没有 截断 输出 。 知 发 生 了 一 个 编码 的 错误 ， 
snprintf 返 回 负 值 。 
虽然 dprintf 不 处 理 文件 指针 ， 但 我 们 仍然 把 它 包 括 在 处 理 格式 化 
输出 的 函数 中 。 注 意 ， 使 用 dprintf 不 需要 调用 fdopen 将 文件 描述 符 转换 
为 文件 指针 (fprintf 需 要 ) 。 
格式 说 明 控 制 其 余 参数 如 何 编写 ， 以 后 又 如 何 显 示 。 每 个 参数 按照 
转换 说 明 编 写 ， 转 换 说 明 以 百 分 号 % 开 始 ， 除 转换 说 明 外 ， 格 式 字 符 串 
中 的 其 他 字符 将 按 原 样 ， 不 经 任何 修改 被 复制 输出 。 一 个 转换 说 明 有 4 
个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 
%[flags][fldwidth][precision ][lenmodifier]convtype 
图 5-7 总 结 了 各 种 标志 。 














ED 将 整数 按 千 位 分 组 字符 
在 字段 内 左 对 齐 输 出 


maarag EM 

如 果 第 一 个 字符 不 是 正 负 号 ， 则 在 其 前 面 加 上 一 个 空格 
指定 男 一 e a 
添加 前 导 0 (而 非 空格 ) 进行 填充 


图 5-7 转换 说 明 中 的 标志 部 分 

fldwidth 说 明 最 小 字段 宽度 。 转 换 后 参数 字符 数 知 小 于 宽度 ， 则 多 
余 字 符 位 置 用 空格 填充 。 字 段 宽 度 是 一 个 非 负 十 进 制 数 ， 或 是 一 个 星 号 
CEY a 

precision 说 明 整 型 转换 后 最 少 输 出 数字 位 数 、 浮 点 数 转 换 后 小 数 点 
后 的 最 少 位 数 、 PATH BUR KH BL MTA OO), Ea 
跟随 一 个 可 选 的 非 负 十 进 制 数 或 一 个 星 号 (*) 。 

宽度 和 精度 字段 两 者 丝 可 为 *。 此 时 ， 一 个 整 型 参数 指定 宽度 或 精 
度 的 值 。 该 整 型 参数 正好 位 于 被 转换 的 参数 之 前 。 

lenmodifier 说 明 参 数 长 度 。 其 可 能 的 值 示 于 图 5-8 中 。 














将 相应 的 参数 按 signed 或 unsigned char 类 型 输出 

将 相应 的 参数 按 signed 或 unsigned short 类 型 输出 

将 相应 的 参数 按 signed 或 unsigned long 或 宽 字 符 类 型 输出 
| 


各 相应 的 参数 按 signed 或 unsigned long long 类 型 输出 


intmax 七 或 uintmax t 


size t 
ptrdiff t 
long double 





图 5-8 转换 说 明 中 的 长 度 修饰 符 

convtype 不 是 可 选 的 。 它 控制 如 何 解释 参数 。 图 5-9 中 列 出 了 各 种 转 
换 类 型 字符 。 

根据 常规 的 转换 说 明 ， 转 换 是 按照 它们 出 现在 format 参 数 之 后 的 顺 
序 应 用 于 参数 的 。 一 种 替代 的 转换 说 明 语 法 也 允许 显 式 地 用 %n$ 序 列 来 
表示 第 n 个 参数 的 形式 来 命名 参数 。 注 意 ， 这 两 种 语法 不 能 在 同一 格式 
说 明 中 混用 。 在 人 蔡 代 的 语法 中 ， 参 数 从 1 开始 计数 。 如 果 参 数 既 没有 提 
供 字 段 宽 度 和 也 没有 提供 精度 ， 通 配 符 星 号 的 语法 就 更 改 为 *sm$，m 指 
明 提 供 值 的 参数 的 位 置 。 


有 符号 十 进 制 

无 符号 八进制 

无 符号 十 进 制 

无 符号 十 六 进 制 

双 精度 浮 点 数 

指数 格式 双 精度 浮 点 数 

根据 转换 后 的 值 解释 为 f、F、e 或 E 


十 六 进 制 指数 格式 双 精 度 浮 点 数 
字符 〈 若 带 长 度 修饰 符 1， 为 宽 字 符 ) 
字符 串 〈 知 珊 长 度 修饰 待 1， 为 宽 字符 ) 
fh in] void 的 指针 
到 目前 为 止 , 此 printf 调用 输出 的 字符 的 数目 将 被 写 入 到 
指针 所 指 回 的 带 符号 整 型 中 
一 个 字符 
宽 字 符 (XSI 扩展， 等 效 于 lc) 
ETE (XSI 扩展 ， 等 效 于 1s) 
图 5-9 转换 说 明 中 的 转换 类 型 





下 列 5 种 printf 族 的 变 体 类 似 于 上 面 的 5 种 ， 但 是 可 变 参 数 表 C.F 
换 成 了 arg。 

#include <stdarg.h> 

#include <stdio.h> 

int vprintf(const char *restrict format, va_list arg); 

int vfprintf(FILE *restrict fp, const char *restrict format, va_list arg); 

int vdprintf(int fd, const char *restrict format, va_list arg); 


六 


int vsprintf(char *restrict buf, const char *restrict format, va_list arg); 
函数 返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 ;， 知 编码 出 错 ， 返 回 负 值 

int vsnprintf(char *restrict buf, size_t n, const char *restrict format, 
va_list arg); 


KORBE: ATH XK, IEA RUBIN, 知 编 码 出 错 ， 


返回 负 值 
在 附录 B 的 出 错 处 理 例 程 中 ， 将 使 用 vsnprintf 函 数 。 
关于 ISO C 标 准 中 有 关 可 变 长 度 参 数 表 的 详细 说 明 请 参阅 Kernighan 
和 Ritchie[1988] 的 7.3 节 。 应 当 了 解 的 是 ， 由 ISO ”CC 提供 的 可 变 长 度 参 数 
表 例 程 〈<stdarg.h> 头 文件 和 相关 的 例 程 ) 与 由 较 早 版 本 UNIX 提 供 的 
<varargs.h> 例 程 是 不 同 的 。 
2. 格式 化 输入 
执行 格式 化 输入 处 理 的 是 3 个 scanf 函 数 。 
#include <stdio.h> 
int scanf(const char *restrict format, ...); 
int fscanf(FILE *restrict fp, const char *restrict format, ...); 
int sscanf(const char *restrict buf, const char *restrict format, ...); 
3 个 函数 返回 值 : WEE aT A; AA EH BBE ER BTA 
文件 尾 端 ， 返 回 EOF 
scanf 族 用 于 分 析 输 入 字符 串 ， 并 将 字符 序列 转换 成 指定 类 型 的 变 
nn 
格式 说 明 控 制 如 何 转换 参数 ， 以 便 对 它们 赋值 。 转 换 说 明 以 % 字 符 
开始 。 除 转换 说 明和 空白 字符 外 ， 格 式 字 符 串 中 的 其 他 字符 必须 与 输入 
匹配 。 知 有 一 个 字符 不 匹配 ， 则 停止 后 续 处 理 ， 不 再 读 输入 的 其 余部 


BP 
一 个 转换 说 明 有 3 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 
%[* ][fldwidth][m][lenmodifier]convtype 











可 选择 的 星 号 CH) 用 于 抑制 转换 。 按 照 转换 说 明 的 其 余部 分 对 输 
入 进行 转换 ， 但 转换 结果 并 不 存放 在 参数 中 。 

fdwidth 说 明 最 大 宽度 〈 即 最 大 字符 数 ) 。lenmodifier 说 明 要 用 转换 
结果 赋值 的 参数 大 小 。 由 printf 函 数 族 文 持 的 长 度 修 饰 符 同 样 得 到 scanf 
族 函 数 的 支持 〈 见 图 5-8 中 的 长 度 修饰 符 表 ) 。 

convtype 字 段 类 似 于 printf 族 的 转换 类 型 字段 ， 但 两 者 之 间 还 有 些 差 
别 。 一 个 差别 是 ， 作 为 一 种 选项 ， 输 入 中 和 带 符 号 的 可 赋予 无 符号 类 型 。 
例如 ， 输 入 流 中 的 -1 可 被 转换 成 4 294 967 295 赋 予 无 符号 整 型 变量 。 图 
5-10 总 结 了 scanf 族 函数 文 持 的 转换 类 型 。 

在 字段 宽度 和 长 度 修 饰 符 之 间 的 可 选项 mm 是 赋值 分 配 符 。 它 可 以 用 
于 %c、%s 以 及 %[ 转 换 符 ， 迫 使 内 存 缓冲 区 分 配 空间 以 接纳 转换 字符 
串 。 在 这 种 情况 下 ， 相 关 的 参数 必须 是 指针 地 址 ， 分 配 的 绥 冲 区 地 址 必 
须 复 制 给 该 指针 。 如 果 调 用 成 功 ， 该 缓冲 区 不 再 使 用 时 ， 由 调用 者 负责 
通过 调用 free 函 数 来 释放 该 绥 冲 区 。 

scanf 浮 数 族 同样 支持 男 外 一 种 转换 说 明 ， 人 允许 显 式 地 命名 参数 : 序 
列 %n$ 代 表 了 第 n 个 参数 。 与 printf 函 数 族 相 同 ， 同 一 编号 的 参数 在 格式 
串 中 可 引用 多 次 。 但 Single UNIX Specification 指 出 ， 这 种 情况 在 scanf 画 
数 族 中 如 何 作 用 还 未 定义 。 
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字符 串 〈 若 带 长 度 修饰 符 1， 为 宽 字符 串 ) 

匹配 列 出 的 字符 序列 ， 以 ] 终 上 

匹配 除 列 出 字符 以 外 的 所 有 字符 ， 以 ] 终 上 

Gln] void 的 指针 

将 到 目前 为 止 该 函数 调用 读 取 的 字符 数 写 入 到 指针 所 指 回 的 无 从 与 整 型 中 
ANY HEE mi 

REN (XSI 扩展 ， 等 效 于 1c) 

EMH (XS, EMF 1s) 


图 5-10 转换 说 明 中 的 转换 类 型 


与 printf 族 相同 ，scanf 族 也 使 用 由 <stdarg.h> 说 明 的 可 变 长 度 参数 


#include <stdarg.h> 

#include <stdio.h> 

int vscanf(const char *restrict format, va_list arg); 

int vfscanf(FILE *restrict fp, const char *restrict format, va_list arg); 

int vsscanf(const char *restrict buf, const char *restrict format, va_list 


ar - 


函数 返回 值 : 指定 的 输入 项 目 数 ， 知 输入 出 错 或 在 任 一 转换 前 文件 


结束 ， 返 回 EOF 


关于 scanf 函 数 族 的 详细 情况 ， 请 参 岗 UNIX 系 统 手 册 。 


5.12 实现 细节 


正如 前 述 ， 在 UNIX 中 ， 标 准 IVO 库 最 终 都 要 调用 第 3 章 中 说 明 的 IO 
例 程 。 每 个 标准 IO 流 都 有 一 个 与 其 相关 联 的 文件 描述 符 ， 可 以 对 一 个 
流 调用 feno 函 数 以 获得 其 描述 符 。 

注意 ，fileno 不 是 ISO C 标 准 部 分 ， 而 是 POSIX.1 文 持 的 扩展 。 

#include <stdio.h> 

int fileno(FILE *fp); 

返回 值 : 与 该 流 相 关联 的 文件 描述 符 

如 果 要 调用 dup 或 fcntl 等 函数 ， 则 需要 此 函数 。 

为 了 了 解 你 所 使 用 的 系统 中 标准 ”VO 库 的 实现 ， 最 好 从 头 文 件 
<stdio.h> 开 始 。 从 中 可 以 看 到 FILE 对 象 是 如 何 定义 的 、 每 个 流标 志 的 定 
义 以 及 定义 为 宏 的 各 个 标准 IO 例 程 〈 如 getc) . Kernighan#ll 
Ritchie[1988] 中 的 8.5 节 含有 一 个 示例 实现 ， 从 中 可 以 看 到 很 多 UNIX 实 
现 的 基本 样式 。Plauger[1992] 的 第 12 章 提供 了 标准 MO 库 一 种 实现 的 全 部 
ees 的 实现 也 是 公开 可 用 的 。 

SEB 

图 5-11 程 序 为 3 个 标准 流 以 及 一 个 与 普通 文件 相关 联 的 流 打 印 有 关 
绥 冲 的 状态 信息 。 





#include "apue ,hn 


void pr_stdio(const char *, FILE *); 
int is unbuffered(FILE *); 

int is linebuffered(FILE *); 

int  buffer_size(FILE *); 


int 
main (void) 
| 
FILE *fp; 


fputs ("enter any character\n", stdout); 
if (getchar() == BOF) 
err sys("getchar error"); 
fputs("one line to standard error\n", stderr); 


pr_stdio("stdin", stdin); 
pr_stdio("stdout", stdout) ; 
pr_stdio("stderr", stderr); 


if ((fp = fopen("/etc/passwd", "r")) == NULL) 
err sys ("fopen error"); 
if (getc(fp) == EOF) 


err_sys("getc error"); 
pr_stdio("/etc/passwd", fp); 
exit (0); 


void 
pr_stdio(const char *name, FILE *fp) 
{ 
printf("stream = %s, ", name); 
if (is_unbuffered (fp) ) 
printf ("unbuffered") ; 
else if (is_linebuffered(fp) ) 
printf("line buffered"); 
else /* if neither of above */ 
print£("f£ully buffered"); 


printf(", buffer size = d\n", buffer_size(fp)); 
} 
/* 
* The following is nonportable. 
E 


#if defined(_IO_UNBUFFERED) 


int 
is_unbuffered(FILE *fp) 
{ 
return(fp->_flags & _IO UNBUFFERED) ; 


int 
is_linebuffered(FILE *fp) 
{ 
return.(fp->_flags & _.1O._LINE_BUF'); 


net 
buffer_size(FILE *fp) 
{ 
return (fp=—>_1LO_but end. = £p=->_1O).buf base) 7 


#elif defined(_ SNBF) 


int 
is_unbuffered(FILE *fp) 
{ 
return(fp->_flags & __SNBF) 


` 


int 
is_linebuffered(FILE *fp) 
{ 
return(fp->_flags & _ SLBF) 


` 


int 
buffer size (FILE *fp) 
{ 


return (fp-> bf. size); 


#elif defined ( IONBF) 


#ifdef LP64 

#define _flag _ pad[4] 
#define ptr _pad[1] 
#define base _ pad[2] 
#fendif 


int 
is_unbuffered (FILE *fp) 
{ 
return (fp-> flag & _IONBF); 


int 
is_linebuffered (FILE *fp) 


{ 
return(fp->_flag & _IOLBF); 


int 
buffer_size(FILE *fp) 
{ 
#ifdef LP64 
return(fp->_base - fp->_ptr); 
#else 
return(BUFSIZ); /* just a guess */ 
endif 
} 


#else 
#error unknown stdio implementation! 


#endif 





图 5-11 对 各 个 标准 1O 流 打印 缓冲 状态 信息 

注意 ， 在 打印 绥 冲 状态 信息 之 前 ， 先 对 每 个 流 执 行 O 操 作 ， 第 一 
个 WO 操作 通常 束 造 成 为 该 流 分 配 缓冲 区 。 本 例 中 的 结构 成 员 和 常量 是 
由 本 书 中 使 用 的 4 种 平台 实现 的 标准 WO 库 定 义 的 。 应 当 了 解 ， 标 准 1/O 库 
实现 在 不 同 的 系统 中 可 能 有 所 不 同 ， 像 本 例 中 的 程序 是 不 可 移植 的 ， 
为 它们 众 入 了 与 特定 实现 相关 的 内 容 。 

如 果 运 行 图 5-11 的 程序 两 次 ， 一 次 使 3 个 标准 流 与 终端 相连 接 ， 男 
一 次 使 它们 重 定 同 到 普通 文件 ， 则 所 得 结果 是 : 

$ ./a.out stdin、stdout 和 stderr 都 连 至 终端 

enter any character 

键入 换行 符 

one line to standard error 

stream = stdin, line buffered, buffer size = 1024 

stream = stdout, line buffered, buffer size = 1024 

stream = stderr, unbuffered, buffer size = 1 

stream = /etc/passwd, fully buffered, buffer size = 4096 

$ ./a.out < /etc/group > std.out 2> std.err 
3 个 流 都 重 定 向 ， 再 次 运行 该 程序 




















$ cat std.err 

one line to standard error 

$ cat std.out 

enter any character 

stream = stdin, fully buffered, buffer size = 4096 

stream = stdout, fully buffered, buffer size = 4096 

stream = stderr, unbuffered, buffer size = 1 

stream = /etc/passwd, fully buffered, buffer size = 4096 

从 中 可 见 ， 访 系统 的 默认 是 : 当 标 准 输入 、 输 出 连 至 终端 时 ， 它 们 
是 行 缓冲 的 。 行 缓冲 的 长 度 是 1 024 字 节 。 注 意 ， 这 并 没有 将 输入 、 输 
出 的 行 长 限制 为 1 024 字 节 ， 这 只 是 缓冲 区 的 长 度 。 如 果 要 将 2 048 F 
节 的 行 写 到 标准 输出 ， 则 要 进行 两 次 write 系统 调用 。 当 将 这 两 个 流 重 
SE I SIEM SCI, EAR RMA eA, REKKE ETA MF 
系统 优先 选用 的 VO KEE CM stat 结构 中 得 到 的 st_blksize 值 ) 。 从 中 
也 可 看 到 ， 标 准 错误 如 它 所 应 该 的 那样 是 不 市 缓冲 的 ， 而 普通 文件 按 系 
统 默认 是 全 缓冲 的 。 











5.13 | 临时 >、 
ISO C 标准 VO 库 提供 了 两 个 函数 以 帮助 创建 临时 文件 。 


#include<stdio.h> 
char *tmpnam(char *ptr); 


返回 值 : 指 癌 唯一 路 径 名 的 指针 
FILE *tmpfile(void); 


BREE: ERJ, BERKE; 和 若 出 错 ， 返 回 NULL 

tmpnam 函数 产生 一 个 与 现 有 文件 名 不 同 的 一 个 有 效 路 径 名 字符 
串 。 每 次 调用 它 时 ， 都 产生 一 个 不 同 的 路 径 名 ， 最 多 调用 次 数 是 
TMP_MAX。TMP_MAX 定义 在 <stdio.h> 中 。 

虽然 ISO”C 定 义 了 TMP_MAX， 但 该 标准 只 要 求 其 值 至 少 应 为 25。 
但 是 ，Single UNIX Specification 却 要 求 符 合 XSI 的 系统 文 持 其 值 至 少 为 
10 000。 虽 然 此 最 小 值 允 许 一 个 实现 使 用 4 位 数字 (0000~9999) 作为 
临时 文件 名 ， 但 是 ， 大 多 数 UNIX 实 现 使 用 的 却 是 大 、 小 写字 符 。 

tmpnam 函数 在 SUSv4 中 被 标记 为 弃 用 ， 但 是 ISO C 标准 还 继续 文 
持 它 。 

若 ptr 是 NULL， 则 所 产生 的 路 径 名 存放 在 一 个 静态 区 中 ， 指 向 该 静 
态 区 的 指针 作为 函数 值 返 回 。 后 续 调 用 tmpnam 时， 会 重 写 该 静态 区 
《这 意味 着 ， 如 果 我 们 调用 此 函数 多 次 ， 而 且 想 保存 路 径 名 ， 则 我 们 应 
当 保存 该 路 径 名 的 副本 ， 而 不 是 指针 的 副本 ) 。 如 若 ptr 不 是 NULL， 则 
认为 它 应 该 是 指 癌 长 度 至 少 是 L_tmpnam 个 字符 的 数组 (常量 L_tmpnam 
定义 在 头 文件 <stdio.h> 中 ) 。 所 产生 的 路 径 名 存放 在 该 数组 中 ，ptr 也 作 
为 函数 值 返回 。 

tmpfile 创建 一 个 临时 二 进 制 文件 〈 类 型 wb+) ， 在 关闭 该 文件 或 程 
人 
X To 

实例 

图 5-12 程 序 说 明了 这 两 个 函数 的 应 用 。 











finclude "apue.h" 


int 

main (void) 

| 
char name[L tmpnam]，1line[MAXLINE] ; 
FILE *fp; 


printf ("$s\n", tmpnam(NULL) ) ; /* first temp name */ 


tmpnam (name) ; /* second temp name */ 
printf("$s\n", name) ; 


if ((fp = tmpfile()) == NULL) /* create temp file */ 
err_sys("tmpfile error"); 
fputs ("one line of output\n", fp); /* write to temp file */ 
rewind (fp) ; /* then read it back */ 
if (fgets(line, sizeof(line), fp) == NULL) 
err Sys ("fgets error"); 
fputs (line, stdout); /* print the line we wrote */ 


exit (0); 


图 5-12 tmpnam 和 tmpfile 函 数 实 例 
执行 图 5-12 的 程序 ， 可 得 : 
$ ./a.out 
/tmp/fileTOHsu6 
/tmp/filekmAsYQ 


one line of output 
tmpfile 函 数 经 常 使 用 的 标准 UNIX 技 术 是 先 调用 tmpnam 产 生 一 个 唯 
一 的 路 径 名 ， 然 后 ， 用 该 路 径 名 创建 一 个 文件 ， 并 立即 unlink 它 。 请 回 
忆 4.15 节 ， 对 一 个 文件 解除 链接 并 不 删除 其 内 容 ， 关 闭 该 文件 时 才 删 除 
其 内 容 。 而 关闭 文件 可 以 是 显 式 的 ， 也 可 以 在 程序 终止 时 自动 进行 。 
Single UNIX Specification 为 处 理 临 时 文件 定义 了 另外 两 个 函数 : 
mkdtemp 和 mkstemp， 它 们 是 XSI 的 扩展 部 分 。 
#include <stdlib.h> 
char *mkdtemp(char *template); 
返回 值 : A, REAA REWE: Aes, JIEINULL 
int mkstemp(char *template); 
返回 值 : ARJ, DCA; aie, e- 
mkdtemp eA 2G) -Hx HKA SEW 
mkstemp 函 数 创 建 了 一 个 文件 ， 该 文件 有 一 个 唯一 的 名 字 。 名 字 是 通过 
template 字 符 串 进行 选择 的 。 这 个 字符 串 是 后 6 位 设置 为 XXXXXX 的 路 
径 名 。 函 数 将 这 些 占 位 符 蔡 换 成 不 同 的 字符 来 构建 一 个 唯一 的 路 径 名 。 
的 话 ， 这 两 个 函数 将 修改 template 字 符 串 反映 临时 文件 的 名 


由 mkdtemp 函 数 创建 的 目录 使 用 下 列 访问 权限 位 集 : S_IRUSR | 
S_TWUSR | S_IXUSR。 注 意 ， 调 用 进程 的 文件 模式 创建 屏蔽 字 可 以 进 一 
步 限 制 这 些 权 限 。 如 果 目 录 创 建成 功 ，mkdtemp 返 回 新 目录 的 名 字 。 

mkstemp 函 数 以 唯一 的 名 字 创 建 一 个 普通 文件 并 且 打 开 访 文件， 该 
函数 返回 的 文件 描述 符 以 读 写 方式 打开 。 由 mkstemp 创 建 的 文件 使 用 访 
问 权 限 位 S_IRUSR | S_IWUSR. 

与 tempfile 不 同 ，mkstemp 创 建 的 临时 文件 并 不 会 自动 删除 。 如 果 项 
望 从 文件 系统 命名 空间 中 删除 该 文件 ， 必 须 自 己 对 它 解 除 链接 。 

使 用 tmpnam 和 tempnam 至 少 有 一 个 缺点 : 在 返回 唯一 的 路 径 名 和 用 
该 名 字 创 建文 件 之 间 存 在 一 个 时 间 窗 口 ， 在 这 个 时 间 窗 口中 ， 男 一 进程 
可 以 用 相同 的 名 字 创 建文 件 。 因 此 应 该 使 用 tmpfile 和 mkstemp 了 水 数 ， 因 
为 它们 不 存在 这 个 问题 。 

实例 

图 5-13 程 序 显 示 了 如 何 使 用 mkstemp 岗 数 。 




















#include "apue.h" 
#include <errno.h> 


void make_temp(char *template) ; 


int 

main () 

{ 
char  good_template[] = "/tmp/dirXXXXXxx"; /* right way */ 
char *bad template = "/tmp/dirXXXXXx"; /* wrong way*/ 


printf ("trying to create first temp file...\n"); 
make temp (good_template) ; 

printf ("trying to create second temp file...\n"); 
make_temp (bad_template) ; 

exit (0); 


void 
make_temp(char *template) 
{ 
int fd; 
struct stat sbuf; 


if ((fd = mkstemp(template)) < 0) 
err_sys("can't create temp file"); 
printf ("temp name = s\n", template); 
close (fd); 
if (stat(template, &sbuf) < 0) { 
if (errno == ENOENT) 
printf ("file doesn't exist\n"); 
else 
err sys("stat failed"); 
} else { 


printf ("file exists\n"); 
unlink (template) ; 


图 5-13 mkstemp 函 数 的 应 用 

运行 图 5.13 中 的 程序 ， 得 到 : 

$ ./a.out 

trying to create first temp file... 

temp name = /tmp/dirUmBT7h 

file exists 

trying to create second temp file... 

Segmentation fault 

两 个 模板 字符 串 声 明 方 式 的 不 同 带 来 了 不 同 的 运行 结 采 。 对 于 第 一 
个 模板 ， 因 为 使 用 了 数组 ， 名 字 是 在 栈 上 分 配 的 。 但 第 二 种 情况 使 用 的 
是 指针 ， 在 这 种 情况 下 ， 只 有 指针 自身 驻 留 在 栈 上 。 编 译 占 把 字符 串 存 
放 在 可 执行 文件 的 只 读 段 ， 当 mkstemp 函数 试图 修改 字符 串 时 ， 出 现 了 
段 错 误 (segment fault) 。 








5.14 内 存 沪 


我 们 已 经 看 到 ， 标 准 IJO 库 把 数据 缓存 在 内 存 中 ， 因 此 每 次 一 字符 
和 每 次 一 行 的 O 更 有 效 。 我 们 也 可 以 通过 调用 setbuf 或 setvbuf 函 数 让 IO 
库 使 用 我 们 自己 的 缓冲 区 。 在 SUSv4 中 支持 了 内 存 流 。 这 就 是 标准 IO 
流 ， 虽 然 仍 使 用 FILE 指 针 进 行 访问 ， 但 其 实 并 没有 底层 文件 。 所 有 的 
WO 都 是 通过 在 绥 冲 区 与 主 存 之 间 来 回 传送 字 节 来 完成 的 。 我 们 将 看 
A 它们 的 某 些 特征 使 其 更 适用 于 字符 串 
BEE 。 

有 3 个 函数 可 用 于 内 存 流 的 创建 ， 第 一 个 是 fmemopen 函 数 。 

#include <stdio.h> 

FILE *fmemopen(void *restrict buf, size_t size, const char *restrict 
type); 








返回 值 : ARJ, BEIE: 知 错 误 ， 返 回 NULL 
fmemopen 函数 允许 调用 者 提供 缓冲 区 用 于 内 存 流 : buf BACHE IZ 
冲 区 的 开始 位 置 ，size 参 数 指定 了 缓冲 区 大 小 的 字 节 数 。 如 果 buf 参 数 为 
衬 ，fmemopen 函 数 分 配 size 字 节 数 的 缓冲 区 。 在 这 种 情况 下 ， 当 流 关 闭 
时 绥 冲 区 会 被 释放 。 
type 参 数控 制 如 何 使 用 流 。type 可 能 的 取 值 如 图 5-14 所 示 。 


r 或 rb 为 读 而 打开 
w 或 wb 为 写 而 打开 


a 或 ab 退 加 ， 为 在 第 一 个 null 字 节 处 写 而 打开 
r+Bk r+b 或 zb+ 为 恋 和 与 而 打开 
w+ 或 wtb 或 wb+ 把 文件 截断 至 0 长 ， 为 读 和 写 而 打开 
at 或 atb 或 apb+ eM; 为 在 第 一 个 null 字 节 处 读 和 写 而 打开 
图 5-14 打开 内 存 流 的 type 参 数 











注意 ， 这 些 取 值 对 应 于 基于 文件 的 标准 IO 流 的 type 参 数 取 值 ， 但 其 





中 有 些微 小 差别 。 第 一 ， 无 论 何 时 以 退 加 写 方式 打开 内 存 流 时 ， 当 前 文 
件 位 置 设 为 缓冲 区 中 的 第 一 个 null 字 节 。 如 果 缓 冲 区 中 不 存在 null 字 他， 
则 当前 位 置 就 设 为 缓冲 区 结尾 的 后 一 个 字 节 。 妆 流 并 不 是 以 妃 加 写 方式 
打开 时 ， 当 前 位 置 设 为 缓冲 区 的 开始 位 置 。 因 为 退 加 写 模式 通过 第 一 个 
nul 字 节 确 定数 据 的 尾 端 ， 内 存 流 并 不 适合 存储 二 进 制 数据 《二进制 数 
据 在 数据 尾 问 之 前 就 可 能 包含 多 个 null] 字 节 ) 。 

第 二 ， 如 果 buf 参 数 是 一 个 null 指 针 ， 打 开 流 进行 读 或 者 写 都 没有 任 
何 意 义 。 因 为 在 这 种 情况 下 绥 冲 区 是 通过 fmemopen 进 行 分 配 的 ， 没 有 
办 法 找到 绥 冲 区 的 地 址 ， 只 写 方式 打开 流 意 味 着 无 法 读 取 已 写 入 的 数 
a is, 以 读 方式 打开 流 意 味 着 只 能 读 取 那些 我 们 无 法 写 入 的 缓冲 区 

第 三 ， 任 何 时 候 需 要 增加 流 缓冲 区 中 数据 量 以 及 调用 fclose、 
fflush、fseek、fseeko 以 及 fsetpos 时 都 会 在 当前 位 置 写 入 一 个 null 字 贡 。 

实例 

有 必要 看 一 下 对 内 存 流 的 写 入 是 如 何在 我 们 自己 提供 的 缓冲 区 上 进 
行 操 作 的 。 图 5-15 给 出 了 用 已 知 模式 填充 缓冲 区 时 流 写 入 是 如 何 操作 
的 。 我 们 在 Linux 上 运行 该 程序 ， 得 到 如 下 结果 : 














#include "apue.h" 
#define BSZ 48 


int 
main () 
{ 
FILE *fp; 
char buf[BSZ]; 


memset (buf, 'a', BSZ-2); 

buf [BSZ-2] = '\0'; 

buf[BSZ-1] = 'X'; 

if ((fp = fmemopen(buf, BSZ, "w+")) == NULL) 
err_sys("fmemopen failed"); 

printf ("initial buffer contents: %s\n", buf); 

fprintf(fp, "hello, world"); 

printf("before flush: %s\n", buf); 

fflush(fp) ; 

printf ("after fflush: %s\n", buf); 

printf ("len of string in buf = %ld\n", (long)strlen(buf)); 


memset (buf, 'b', BSZ-2); 

buf[BSZ-2] = '\0'; 

buf[BS2-1] = 'X'; 

fprintf(fp, "hello, world"); 

fseek(fp, 0, SEEK_SET); 

printf ("after fseek: %s\n", buf); 

printf("len of string in buf = %ld\n", (long)strlen(buf)); 


memset (buf, 'c', BSZ-2); 

buf [BSZ-2] = '\0'; 

buf (BSZ-1] = 'X'; 

fprintf (fp, "hello, world"); 

fclose (fp); 

printf ("after fclose: $s\n", buf); 

printf ("len of string in buf = %ld\n", (long) strlen (buf) ) ， 


return (0) ， 





图 5-15 观察 内 存 流 的 写 入 操作 

$ ./a.out 

initial buffer contents: fmemopen 在 缓冲 区 开始 处 
放置 null 字 节 

before flush: 

after fflush: hello, world 

len of string in buf = 12 nul 字 节 加 到 字符 串 结 尾 

用 a 字 符 改 写 缓冲 区 

流 冲 洗 后 缓冲 区 才 会 变化 

现在 用 b 字 符 改写 绥 冲 区 

after fseek: bbbbbbbbbbbbhello, world fseek 引 起 缓冲 区 冲洗 











len of string in buf = 24 再 次 追加 写 null 字 节 

现在 用 c 字 符 改 写 缓冲 区 after fclose: hello, 
WorldcccccccccccccccccccccccccccccccccC 

len of string in buf = 46 WA EMS null 














a Ze th SA At AB DS null RR. BAA RT 
以 及 推进 流 的 内 容 大 小 〈 相 对 缓冲 区 大 小 而 言 ， 该 大 小 是 固定 的 ) 这 个 
概念 时 ，null 字 节 会 自动 退 加 写 。 流 内 容 大 小 是 由 写 入 多 少 来 确定 的 。 

在 本 书 所 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 文 持 内 存 流 。 这 是 具体 
实现 还 没有 跟 上 最 新 的 标准 ， 相 信 随 着 时 间 的 推移 ， 这 种 情况 会 有 所 改 

用 于 创建 内 存 流 的 其 他 两 个 函数 分 别 是 open_memstream 和 
open_wmemstream 。 

#include <stdio.h> 

FILE *open_memstream(char **bufp, size_t *sizep); 

#include <wchar.h> 

FILE *open_wmemstream(wchar_t **bufp, size_t *sizep); 

两 个 函数 的 返回 值 : A, RERE: Aas, JK IEINULL 

open_memstream 函 数 创建 的 流 是 面 癌 字 节 的 ，open_wmemstream 函 
数 创建 的 流 是 面向 宽 字 节 的 《回忆 5.2 节 中 对 于 多 字 节 字符 的 说 明 ) 。 
这 两 个 函数 与 fmemopen 函 数 的 不 同 在 于 : 

“创建 的 流 只 能 写 打开 ; 














“不 能 指定 上 自己 的 缓冲 区 ， 但 可 以 分 别 通过 bufp 和 sizep 参 数 访问 组 
冲 区 地 址 和 大 小 ; 

“关闭 流 后 需要 上 自行 释放 缓冲 区 ; 

对 流 琴 加 字 节 会 增加 缓冲 区 大 小 。 

但 是 在 缓冲 区 地 址 和 大 小 的 使 用 上 必须 遵循 一 些 原则 。 第 一 ， 绥 冲 
区 地 址 和 长 度 只 有 在 调用 fclose 或 fflush 后 才 有 效 ; 第 二 ， 这 些 值 只 有 在 
下 一 次 流 写 入 或 调用 fclose 前 才 有 效 。 因 为 缓冲 区 可 以 增长 ， 可 能 需要 
重新 分 配 。 如 果 出 现 这 种 情况 ， 我 们 会 有 友 现 缓冲 区 的 内 存 地 址 值 在 下 一 
次 调用 fclose 或 fflush 时 会 改变 。 

因为 避免 了 缓冲 区 淤 出 ， 内 存 流 非 常 适 用 于 创建 字符 串 。 因 为 内 存 
流 只 访问 主 存 ， 不 访问 磁盘 上 的 文件 ， 所 以 对 于 把 标准 IO 流 作 为 参数 
用 于 临时 文件 的 函数 来 说 ， 会 有 很 大 的 性 能 提升 。 


5.15 标准 MO 的 符 代 软件 


标准 1O 库 并 不 完善 。Korn 和 Vo[1991] 列 出 了 它 的 很 多 不 足 之 处 ， 
其 中 ， 某 些 属 于 基本 设计 ， 但 是 大 多 数 则 与 各 种 不 同 的 实现 有 关 。 

标准 IO 库 的 一 个 不 足 之 处 是 效率 不 高 ， 这 与 它 需 要 复制 的 数据 量 
有 关 。 当 使 用 每 次 一 行 函 数 fgets 和 fputs 时 ， 通 常 需要 复制 两 次 数据 : 一 
次 是 在 内 核 和 标准 IO 缓冲 区 之 间 《〈 当 调用 read 和 write 时 ) ， 第 二 次 是 在 
标准 IO 缓冲 区 和 用 户 程序 中 的 行 缓冲 区 之 间 。 人 快速 IO 库 [AT&T 1990a 
中 的 fio(3)] 避 免 了 这 一 点 ， 其 方法 是 使 读 一 行 的 函数 返回 指 问 该 行 的 指 
针 ， 而 不 是 将 该 行 复制 到 男 一 个 缓冲 区 中 。Hume[1988] 报 告 : 由 于 做 了 
这 种 更 改 ，grep(1) 实 用 程序 的 速度 提升 了 3 倍 。 

Korn 和 Vo[1991] 说 明了 标准 WO 库 的 另 一 种 蔡 代 版 :sfio。 这 一 软件 
包 在 速度 上 与 fo 相近 ， 通 常 快 于 标准 IO 库 。sfio 软 件 包 也 提供 了 一 些 其 
他 标准 MO 库 所 没有 的 新 特征 : 推广 了 WO 流 ， 使 其 不 仪 可 以 代表 文件 ， 
也 可 代表 存储 区 ;， 可 以 编写 处 理 模 块 ， 并 以 栈 方式 将 其 压 入 1/O 流 ， 这 
样 就 可 以 改变 一 个 流 的 操作 ， 较 好 的 异常 处 理 等 。 

Krieger、Stumm 和 Unrau[1992] 说 明了 男 一 个 蔡 代 软件 包 ， 它 使 用 了 
映射 文件 mmap 函 数 ， 我 们 将 在 14.8 节 中 说 明 此 函数 。 访 新 软件 包 
称 为 ASI (Alloc Stream Interface) 。 其 编程 接口 类 似 于 UNIX 系 统 存储 
分 配 函 数 (malloc、realloc 和 free， 这 些 函 数 将 在 7.8 节 中 说 明 ) 。 与 sfio 
软件 包 相 同 ，ASI 使 用 指针 力图 减少 数据 复制 量 。 

许多 标准 IO 库 实 现在 C 函 数 库 中 可 用 ， 这 种 C 函 数 库 是 为 内 存 较 小 
的 系统 ， 如 艇 入 式 系 统 设计 的 。 这 些 实现 对 于 合理 内 存 要 求 的 关注 超过 
对 可 移植 性 、 速 度 以 及 功能 性 等 方面 的 关注 。 这 种 类 型 函数 库 的 两 种 实 
现 是 : uClibc C 库 〈 人 参阅 http:/www.uclibc.org ) 和 Newlib C 库 
(http://www. source.redhat.com/newlib) 。 


























5.16 小 结 


大 多 数 UNIX 应 用 程序 都 使 用 标准 VO 库 。 本 章 说 明了 该 库 提供 的 很 
多 函数 以 及 录 些 实现 细节 和 效率 方面 的 考虑 。 应 该 看 到 ， 标 准 WO 库 使 
用 了 绥 冲 技术 ， 而 它 正 是 产生 很 多 问题 、 引 起 许多 混 消 的 部 分 。 


5.1 用 setvbuf 实 现 setbuf。 

5.2 图 5-5 中 的 程序 利用 每 次 一 行 JO (fgets 和 fputs 函 数 ) 复制 文件 。 
各 将 程序 中 的 MAXLINE 改 为 4， 当 复制 的 行 超过 该 最 大 值 时 会 出 现 什么 
情况 ? 对 此 进行 解释 。 

5.3 printf 返 回 0 值 表示 什么 ? 

5.4 下 面 的 代码 在 一 些 机 器 上 运行 正确 ， 而 在 另外 一 些 机 器 运行 时 
出 错 ， 解 释 问 题 所 在 。 

#include <stdio.h> 

int 

main(void) 





char c; 
while ((c = getchar()) != EOF) 
putchar(c); 


5.5 对 标准 MO 流 如 何 使 用 fsync 函 数 〈 见 3.13 节 ) ? 

5.6 在 图 1-7 和 图 1-10 程 序 中 ， 打 印 的 提示 信息 没有 包含 换行 符 ， 程 
序 也 没有 调用 fflush 函 数 ， 请 解释 输出 提示 信息 的 原因 是 什么 ? 

5.7 基于 BSD 的 系统 提供 了 funopen 的 函数 调用 使 我 们 可 以 拦截 读 、 
写 、 定 位 以 及 关闭 一 个 流 的 调用 。 使 用 这 个 函数 为 FreeBSD 和 Mac OS X 
实现 fmemopen 。 








6.1 518 


UNIX 系 统 的 正常 运作 需要 使 用 大 量 与 系统 有 关 的 数据 文件 ， 例 
如 ， 口 令 文件 /etc/passwd 和 组 文件 /etc/group 就 是 经 常 被 多 个 程序 频繁 使 
用 的 两 个 文件 。 用 户 每 次 登录 UNIX 系 统 ， 以 及 每 次 执行 ls -] 命 令 时 都 要 
使 用 口令 文件 。 

由 于 历史 原因 ， 这 些 数据 文件 都 是 ASCII 文 本 文件 ， 并 且 使 用 标准 
1/O 库 读 这 些 文件 。 但是， 对 于 较 大 的 系统 ， 顺 序 扫描 口令 文件 很 花费 
时 间 ， 我 们 需要 能 够 以 非 ASCII 文 本 格式 存放 这 些 文件 ， 但 仍 同 使 用 其 
他 文件 格式 的 应 用 程序 提供 接口 。 对 于 这 些 数据 文件 的 可 移植 接口 是 本 
章 的 主题 。 本 章 也 包括 了 系统 标识 函数 、 时 间 和 日 期 函数 。 





6.2 口令 文件 


UNIX 系统 口令 文件 (POSIX.1 则 将 其 称 为 用 户 数据 库 ) 包含 了 图 
6-1 中 所 示 的 各 字段 ， 这 些 字段 包含 在 <pwd. h> 中 定义 的 passwd 结 构 中 。 

注意 ，POSIX.1 只 指定 passwd 结 构 包 含 的 10 个 字段 中 的 5 个 。 大 多 数 
平台 至 少 支持 其 中 7 个 字段 。BSD 派 生 的 平台 支持 全 部 10 个 字段 。 


Wy a FreeBSD | Linux | MacOS 

















ma lde ae pw_name 
id char *pw passwd 
数值 用 户 D uidt pw_uid 
ACA ID gid t pw gid 
注释 字段 char *pw_gecos 
Ma LEEK char *pw dir 
Aitishell (用 户 程序 ) | char *pw_shell 
用 户 访问 类 char *pw class 
下 次 更 改口 令 时 间 | time t pw change 
账户 有 效 期 时间 time t pw_expire 


图 6-1 /etc/passwd 文 件 中 的 字段 
由 于 历史 原因 ， 口 令 文 件 是 /etc/passwd， 而 且 是 一 个 ASCII 文件 。 








每 一 行 包含 图 6-1 中 所 示 的 各 字段 ， 字 段 之 间 用 冒号 分 隔 。 例 如 ， 在 
Linux 中 ， 该 文件 中 可 能 有 下 列 4 行 : 
root:x:0:0:root:/root:/bin/bash 
squid:x:23:23::/var/spool/squid:/dev/null 
nobody:x:65534:65534:Nobody:/home:/bin/sh 
sar:x:205:105: Stephen Rago: /home/sar:/bin/bash 
天 于 这 些 登 录 项 ， 请 注意 下 列 各 点 : 





“通常 有 一 个 用 户 名 为 root 的 登录 项 ， 其 用 户 ID 是 0 (超级 用 户 ) 。 

。 加 密 口 令 字 上 段 包含 了 一 个 占 位 符 。 较 早期 的 UNIX 系 统 版 本 中 ， 访 
字段 存放 加 密 口 令 字 。 将 加 密 口 令 字 存放 在 一 个 人 人 可 读 的 文件 中 是 一 
个 安全 性 漏洞 ， 所 以 现在 将 加 密 口 令 字 存放 在 另 一 个 文件 中 。 在 下 一 节 
讨论 口令 字 时 ， 我 们 将 详细 涉及 此 问题 。 

。 口令 文件 项 中 的 某 些 字段 可 能 是 空 。 如 果 加 密 口 令 字 段 为 空 ， 这 
通常 就 意味 着 该 用 户 没 有 口令 (不 推荐 这 样 做 ) 。squid 登 录 项 有 一 空白 
字段 : 注释 字段 。 空 白 注释 字段 不 产生 任何 影响 。 

。 shell 字 段 包含 了 一 个 可 执行 程序 名 ， 它 被 用 作 该 用 户 的 登录 
shell。 知 该 字段 为 空 ， 则 取 系 统 默 认 值 ， 通 党 是 bin/sh。 注 意 ，squid 登 
录 项 的 该 字段 为 /dev/null。 显 然 ， 这 是 一 个 设备 ， 不 是 可 执行 文件 ， 将 
其 用 于 此 处 的 目的 是 ， 阻 止 任何 人 以 用 户 squid 的 名 义 登录 到 该 系统 。 

很 多 服务 对 于 帮助 它们 得 以 实施 的 不 同 守 护 进 程 使 用 不 同 的 用 户 
〈 见 第 13 章 ) ，squid 项 是 为 实现 squid 代 理 高 速 绥 存 服务 的 进程 设置 
es 

。 为 了 阻止 一 个 特定 用 户 登 录 系 统 ， 除 使 用 /devmnull 外 ， 还 有 知 干 种 
蔡 代 方法 。 常 见 的 一 种 方法 是 ， 将 /bin/false 用 作 登 录 shell。 它 简单 地 以 
不 成 功 ( 非 O 状态 终止 ， 该 shell 将 此 种 终止 状态 判断 为 假 。 另 一 种 第 
见方 法 是 ， 用 /bin/true 禁 止 一 个 账户 。 它 所 做 的 一 切 是 以 成 功 (0) 状态 
终止 。 某 些 系统 提供 nologin 命令 ， 它 打印 可 定制 的 出 错 信 息 ， 然 后 以 
非 0 状 态 终 止 。 

。 使 用 nobody 用 户 名 的 一 个 目的 是 ， 使 任何 人 都 可 登录 至 系统 ， 但 
其 用 户 ID (65534) 和 组 ID (65534) 不 提供 任何 特权 。 该 用 户 ID 和 组 
ID 只 能 访问 人 人 缘 可 读 、 写 的 文件 。 (假定 用 户 ID 65534 和 组 ID 65534 
并 不 拥有 任何 文件 ， 而 实际 情况 就 应 如 此 。) 

。 提供 finger(1) 命 令 的 某 些 UNIX 系统 支持 注释 字段 中 的 附加 信 
妃 。 其 中 ， 各 部 分 之 间 都 用 喜 号 分 隔 : 用 户 姓名 、 办 公 室 地 点 、 办 公 室 
电话 号 码 以 及 家 庭 电话 号 码 等 。 另 外 ， 如 果 注 释 字 段 中 的 用 户 姓 名 是 一 
个 &&， 则 它 被 蔡 换 为 登录 名 。 例 如 ， 可 以 有 下 列 记录 : 

sar:X:205:105:Steve Rago, SF 5-121, 555-1111, 555- 
2222:/home/sar:/bin/sh 

使 用 finger 命 令 就 可 打印 Steve Rago 的 有 关 信 息 。 

$ finger -p sar 






































Login: sar Name: Steve Rago 
Directory: /home/sar Shell: /bin/sh 
Office: SF 5-121, 555-1111 Home Phone: 555-2222 


On since Mon Jan 19 03:57 (EST) on ttyv0 (messages off) 


No Mail. 

即使 你 所 使 用 的 系统 并 不 支持 finger 命 令 ， 这 些 信息 仍 可 存放 在 注 
释 字 段 中 ， 该 字段 只 是 一 个 注释 ， 并 不 由 系统 实用 程序 解释 。 

某 些 系统 提供 了 vipw 命令， 允许 管理 员 使 用 该 命令 编辑 口令 文 
件 。vipw ”命令 串 行 化 地 更 改口 令 文 件 ， 并 且 确 保 它 所 做 的 更 改 与 其 他 
Dae cr a ogsers 
功能 。 

POSIX.1 定 义 了 两 个 获取 口令 文件 项 的 函数 。 在 给 出 用 户 登录 名 或 
数值 用 户 ID 后 ， 这 两 个 函数 就 能 查看 相关 项 。 

#include<pwd.h>struct passwd *getpwuid(uid_t uid);struct passwd 
*9etpwnam(const char *name); 

两 个 函数 返回 值 ， ARJ, GRIT; Aes, JK IEINULL 

getpwuid 函 数 由 1s() 程 序 使 用 ， 它 将 i 节 点 中 的 数字 用 户 ID 映射 为 用 
户 登 录 名 。 在 键入 登录 名 时 ，getpwnam 函 数 由 login(1) 程 序 使 用 。 

这 两 个 函数 都 返回 一 个 指向 passwd 结 构 的 指针 ， 该 结构 已 由 这 两 个 
函数 在 执行 时 填 入 信息 。passwd 结构 通常 是 函数 内 部 的 静态 变量 ， 只 要 
调用 任 一 相关 函数 ， 其 内 容 就 会 被 重 写 。 

如 果 要 查看 的 只 是 登录 名 或 用 户 ID， 那 么 这 两 个 POSIX.1 函 数 能 满 
足 要 求 ， 但 是 也 有 些 程序 要 奉 看 整个 口令 文件 。 下 列 3 个 函数 则 可 用 于 
此 种 目的 。 

#include <pwd.h> 

struct passwd *getpwent(void); 

返回 值 : ARI, BEE: 知 出 错 或 到 达 文 件 尾 器， 返回 NULL 

void setpwent(void); 

void endpwent(void); 

基本 POSIX.1 标 准 没 有 定义 这 3 个 函数 。 在 Single UNIX Specification 
Bee Crater i eerie ee 
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调用 getpwent 时 ， 它 返回 口令 文件 中 的 下 一 个 记录 项 。 如 同上 面 所 
述 的 两 个 POSIX.1 函 数 一 样 ， 它 返回 一 个 由 它 填 写 好 的 passwd 结构 的 指 
针 。 每 次 调用 此 函数 时 都 重 写 该 结构 。 在 第 一 次 调用 该 函数 时 ， 它 打开 
它 所 使 用 的 各 个 文件 。 在 使 用 本 函数 时 ， 对 口令 文件 中 各 个 记录 项 的 安 
i E E 文件 中 各 项 排 
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函数 setpwent 反 绕 它 所 使 用 的 文件 ，endpwent 则 关闭 这 些 文件 。 在 
使 用 getpwent 得 看 完 口令 文件 后 ， 一 定 要 调用 endpwent 关 闭 这 些 文件 。 
getpwent 知 道 什么 时 间 应 当 打开 它 所 使 用 的 文件 〈 第 一 次 被 调用 时 ) ， 
































但 是 它 并 不 知道 何 时 关闭 这 些 文件 。 
实例 
图 6-2 程 序 给 出 了 getpwnam 函 数 的 一 个 实现 。 
finclude “pwd,h> 
finclude <stddef.h> 
finclude <string.h> 


struct passwd * 
getpwnam(const char *name) 


| 


struct passwd *ptr; 


setpwent () ; 
while ((ptr = getpwent()) != NULL) 
if (strcmp(name, ptr->pw name) == 0) 


break; /* found a match */ 
endpwent () ; 
return (ptr); /* ptr is NULL if no match found */ 


图 6-2 getpwnam ef 2 
在 函数 开始 处 调用 setpwent 是 自我 保护 性 的 措施 ， 以 便 确 保 如 果 调 
用 者 在 此 之 前 已 经 调用 getpwent 打 开 了 有 关 文 件 情况 下 ， 反 绕 有 关 文 件 
使 它们 定位 到 文件 开始 处 。getpwnam 和 getpwuid 完 成 后 不 应 使 有 关 文 件 
仍 处 于 打开 状态 ， 所 以 应 调用 endpwent 关 闭 它们 。 





6.3 阴影 口令 


加 密 口 令 是 经 单 癌 加 密 算 法 处 理 过 的 用 户口 令 副 本 。 因 为 此 算法 是 
单 回 的 ， 所 以 不 能 从 加 密 口 令 猜 测 到 原来 的 口令 。 

历史 上 使 用 的 算法 总 是 在 64 字 符 集 [a-zA-Z0-9./] 中 产生 13 个 可 打印 
字符 《〈 见 Morris 和 和 Thompson [1979]) 。 某 些 较 新 的 系统 使 用 其 他 方法 ， 
如 MD5 或 SHA-1 算 法 ， 对 口令 加 密 ， 产 生 更 长 的 加 密 口 令 字 符 串 。《〈 加 
密 口令 的 字符 越 多 ， 这 些 字符 的 组 合 也 就 越 多 ， 于 是 用 各 种 可 能 组 合 来 
请 测 口令 的 难度 就 越 大 。) 当 我 们 将 单个 字符 放 在 加 蜜 口令 字段 中 时 ， 
可 以 确保 任 一 加 密 口 令 都 不 会 与 其 相 匹配 。 

对 于 一 个 加 密 口 令 ， 找 不 到 一 种 算法 可 以 将 其 反 变 换 到 明文 口令 
(明文 口令 是 在 Password: 提 示 后 键入 的 口令 ) 。 但 是 可 以 对 口令 进行 猜 
测 ， 将 猜测 的 口令 经 单 同 算法 变换 成 加 密 形 式 ， 然 后 将 其 与 用 户 的 加 密 
口令 相 比 较 。 如 果 用 户口 令 是 随机 选择 的 ， 那 么 这 种 方法 并 不 是 很 有 
用 。 但 是 用 户 往 往 以 非 随机 方式 选择 口令 (如 配偶 的 姓名 、 街 名 、 宠 物 
名 等 ) 。 一 个 经 常 重复 的 实验 是 先 得 到 一 份 口令 文件 ， 然 后 用 试探 方法 
崩 测 口令 。《〈Garfinkel 等 [2003] 的 第 4 章 对 UNIX 口 令 及 口令 加 密 处 理 方 
案 的 历史 情况 及 细节 进行 了 说 明 。) 

为 使 企图 这 样 做 的 人 难以 获得 原始 资料 〈 加 蜜 口令 )》， 现 在 ， 某 些 
系统 将 加 和 密 口 令 存放 在 男 一 个 通常 称 为 阴影 口令 (shadow password) 的 
文件 中 。 该 文件 至 少 要 包含 用 户 名 和 加 密 口令 。 与 该 口令 相关 的 其 他 信 
恩 也 可 存放 在 该 文件 中 (图 6-3) 。 























用 户 登 录 名 char *sp_namp 
加 密 口令 char *sp pwdp 
上 次 更 改口 令 以 来 经 过 的 时 间 int sp_lstchg 
经 多 少 天 后 允许 更 改 int sp min 


要 求 更 改 尚 余 天 数 int sp max 

超期 警告 天 数 int sp warn 

账户 不 活动 之 前 尚 余天 数 int sp_inact 

We FA int sp_expire 

保留 unsigned int sp flag 





图 6-3 /etc/shadow 文 件 中 的 字段 

只 有 用 户 登 录 名 和 加 密 口 令 这 两 个 字段 是 必须 的 。 其 他 的 字段 控制 
口令 更 改 的 频率 ， 或 者 说 口令 的 衰老 以 及 账户 仍然 处 于 活动 状态 的 时 
间 。 

明 影 口令 文件 不 应 是 一 般 用 户 可 以 读 取 的 。 仅 有 少数 几 个 程序 需要 
访问 加 密 口令 ， 如 ]ogin(1) 和 passwd(1)， 这 些 程序 常常 是 设置 用 户 ID 为 
ea 的 程序 。 有 了 阴影 口令 后 ， 普 通 口令 文件 /etcpasswd 可 由 各 用 户 自 

读 取 。 

在 Linux 3.2.0 和 Solaris 10 中 ， 与 访问 口令 文件 的 一 组 函数 相 类 似 ， 
有 男 一 组 函数 可 用 于 访问 阴影 口令 文件 。 

#include <shadow.h> 

struct spwd *getspnam(const char *name); 

struct spwd *getspent(void); 

两 个 函数 返回 值 : 知 成 功 ， 返 回 指针 ;大 出 错 ， 返 回 NULL 
void setspent(void); 

void endspent(void); 

在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 没 有 阴影 口令 结构 。 附 加 的 
账户 信息 存放 在 口令 文件 中 《〈 见 图 6-1) 。 




















6.4 组 文件 


UNIX 组 文 fF (POSIX.1 称 其 为 组 数据 库 ) 包含 了 图 6-4 中 所 示 字 
段 。 这 些 字段 包含 在 <grph> 中 所 定义 的 group 结 构 中 。 














ae char *gr_name 
加 密 口 令 char *gr passwd 
MEAD  |int gr gid 
KUNPRE 
pgg | char tonen 


图 6-4 /etc/group 文 件 中 的 字段 
字段 gr_mem 是 一 个 指针 数组 ， 其 中 每 个 指针 指 癌 一 个 属于 该 组 的 








HEZ. 该 数组 以 null 指 针 结 尾 。 可 以 用 下 列 两 个 由 POSIX.1 定 义 的 函数 
来 查看 组 名 或 数值 组 ID。 
#include <grp.h> 
struct group *getgrgid(gid_t gid); 
struct group *getgrnam(const char *name); 
两 个 函数 返回 值 : ARJ, BEJE: Ait, IREINULL 
如 同 对 口令 文件 进行 操作 的 函数 一 样 ， 这 两 个 函数 通常 也 返回 指 癌 
一 个 静态 变量 的 指针 ， 在 每 次 调用 时 都 重 写 该 静态 变量 。 
如 条 需 要 搜索 整个 组 文件 ， 则 须 使 用 另外 几 个 函数 。 下 列 3 个 函数 
类 似 于 针对 口令 文件 的 3 个 函数 。 
#include <grp.h> 
struct group *getgrent(void); 
返回 值 : 大 成功， 返回 指针 ;， 辱 出 错 或 到 达 文 件 尾 痢 ， 人 返回 NULL 
void setgrent(void); 
void endgrent(void); 
这 3 个 函数 不 是 基本 POSIX.1 标 准 的 组 成 部 分 。Single UNIX 


Specification 的 XSI 扩 展 定义 了 这 些 函 数 。 所 有 UNIX 系 统 都 提供 这 3 个 函 
数 。 


setgrent 轴 数 打开 组 文件 《如 在 它 尚 末 被 打开 ) IF RSE. getgrent 
函数 从 组 文件 中 读 下 一 个 记录 ， 如 大 该 文件 尚未 打开 ， 则 先 打开 和 它 。 
endgrent 函 数 关 闭 组 文件 。 


6.5 附属 组 ID 


在 UNIX 系 统 中 ， 对 组 的 使 用 已 经 做 了 些 更 改 。 在 V7 中 ， 每 个 用 户 
任何 时 候 都 只 属于 一 个 组 。 当 用 户 登 录 时 ， 系 统 就 按 口 令 文件 记录 项 中 
的 数值 组 ID ， 赋 给 他 实际 组 ID 。 可 以 在 任何 时 候 执行 newgrp(1) 以 更 改 
组 ID。 如 采 newgrp 命 令 执 行 成 功 〈 关 于 权限 规则 ， 请 参阅 手册 ) ， 则 实 
际 组 ID 就 更 改 为 新 的 组 人 D， 它 将 被 用 于 后 续 的 文件 访问 权限 检查 。 执 
行 不 带 任何 参数 的 newgrp， 则 可 返回 到 原来 的 组 。 

这 种 组 成 员 形式 一 直 维 持 到 1983 年 左右 。 此 时 ，4.2BSD 引 入 了 附属 
组 ID (supplementary group ID) 的 概念 。 我 们 不 仅 可 以 属于 口令 文件 记 
录 项 中 组 ID 所 对 应 的 组 ， 也 可 属于 多 至 16 个 另外 的 组 。 文 件 访问 权限 检 
碍 相应 被 修改 为 : 不 仅 将 进程 的 有 效 组 ID 与 文件 的 组 ID 相 比 较 ， 而 且 也 
将 所 有 附属 组 ID 与 文件 的 组 ID 进行 比较 。 

附属 组 ID 是 POSIX.1 要 求 的 特性 。 (在 较 早 的 POSIX.1 版 本 中 ， 
该 特性 是 可 选 的 。) 常量 NGROUPS_MAX 〈 见 图 2-11) 规定 了 附属 组 
ID 的 数量 ， 其 常用 值 是 16〈 见 图 2-15)。 

使 用 附属 组 ID 的 优点 是 不 必 再 显 式 地 经 常 更 改组 。 一 个 用 户 会 参 
与 多 个 项 目 ， 因 此 也 就 要 同时 属于 多 个 组 ， 此 类 情况 是 常 有 的 。 

为 了 获取 和 设置 附属 组 ID， 提 供 了 下 列 3 个 函数 。 

#include <unistd.h> 

int getgroups(int gidsetsize, gid_t grouplist[]); 

返回 值 : 大 成 功 ， 返 回 附属 组 ID 数量 ; Aa, e- 

#include <grp.h> /* on Linux */ 

#include <unistd.h> /* on FreeBSD, Mac OS X, and Solaris */ 

int setgroups(int ngroups, const gid_t grouplist[]); 

#include <grp.h> /* on Linux and Solaris */ 

#include <unistd.h> /* on FreeBSD and Mac OS X */ 

int initgroups(const char *username, gid_t basegid); 

两 个 函数 的 返回 值 : 徊 成 功 ， 返 回 0; 大 出 错 ， 返 回 -1 

在 这 3 个 函数 中 ，POSIX.1 只 说 明了 getgroups。 因 为 setgroups 和 
initgroups 是 特权 操作 ， 所 以 它们 并 非 POSIX.1 的 组 成 部 分 。 但 是 ， 本 书 
说 明 的 所 有 4 种 平台 都 文 持 这 3 个 函数 。 在 Mac OS X 10.6.8 中 ，basegid 
被 声明 为 int 类 型 。 

getgroups 将 进程 所 属 用 户 的 各 附属 组 ID 填 写 到 数组 grouplist 中 ， 填 











写 入 该 数组 的 附属 组 ID 数 最 多 为 gidsetsize 个 。 实 际 填 写 到 数组 中 的 附属 
组 ID 数 由 函数 返回 。 

作为 一 种 特殊 情况 ， 如 若 gidsetsize 为 0， 则 函数 只 返回 附属 组 ID 
数 ， 而 对 数组 grouplist 则 不 做 修改 。 (这 使 调用 者 可 以 确定 grouplist 数 组 
的 长 度 ， 以 便 进行 分 配 。) 

setgroups 可 由 超级 用 户 调用 以 便 为 调用 进程 设置 附属 组 ID 表 。 
grouplist 是 组 ID 数组 ， 而 ngroups 说 明了 数组 中 的 元 素数 。ngroups 的 值 不 
能 大 于 NGROUPS_MAX。 

通常 ， 只 有 initgroups 函 数 调用 setgroups，initgroups 读 整个 组 文件 

《用 前 面 说 明 的 函数 getgrent、setgrent 和 endgrent) ， 然 后 对 username 确 

定 其 组 的 成 员 关 系 。 然 后 ， 它 调用 setgroups， 以 便 为 该 用 户 初 始 化 附属 
组 ID 表 。 因 为 initgroups 要 调用 setgroups， 所 以 只 有 超级 用 户 才能 调用 
initgroups。 除 了 在 组 文件 中 找到 username 是 成 员 的 所 有 组 ， initgroups 
也 在 附属 组 ID 表 中 包括 了 basegid。basegid 是 username 在 口令 文件 中 的 组 
ID. 

只 有 少数 几 个 程序 调用 initgroups， 例 如 login(1) 程 序 在 用 户 登 录 时 
调用 该 函数 。 











6.6 实现 [区别 


我 们 已 讨论 了 Linux 和 Solaris 文 持 的 阴影 口令 文件 。EFreeBSD 和 Mac 
ee ee ee F. 图 6-5 总 结 了 本 书 涉及 的 4 种 平台 如 
何 存储 用 户 和 组 信息 


FreeBSD 8.0 Linux 3.2.0 = Solaris 10 


PRs etc/passwd CO elaid K [etc/passwd 


/etc/master.passwd | /etc/shadow | Hæ iR: [etc/shadow 


H, 不 N 不 
下 a) A 











/etc/group /etc/group KK /etc/group 


图 6-5 账户 实现 的 区 别 

在 FreeBSD 中 ， 阴 影 口令 文件 是 /etc/master.passwd。 可 以 使 用 特殊 
命令 编辑 该 文件 ， 它 会 从 阴影 口令 文件 产生 /etc/passwd 的 一 个 副本 。 男 
外 ， 也 产生 该 文件 的 散 列 副本 。/etc/pwd.db 是 /etc/passwd 的 散 列 副 
本 ，/etc/spwd.db 是 /etc/master.passwd 的 散 列 版 本 。 这 些 为 大 型 安装 的 系 
统 提 供 了 更 好 的 性 能 。 

但 是 ，Mac OS X 只 在 单 用 户 模式 下 使 用 /etwpasswd 
和 /etc/master.passwd 《在 维护 系统 时 ， 单 用 户 模式 通常 意味 着 不 能 提供 
任何 系统 服务 ) 。 在 正常 运行 期 间 的 多 用 户 模 式 ， 目录 服务 守护 进程 提 
供 对 用 户 和 组 账户 信息 的 访问 。 

虽然 Linux 和 Solaris 支 持 类 似 的 阴 曙 乡 口令 接口 ， 但 两 者 之 间 存 在 某 些 
细微 的 和 差别。 例如， 图 6-3 中 所 示 的 整数 字段 在 Solaris 中 定义 为 int 类 型 ， 
而 在 Linux 中 则 定义 为 long int。 男 一 个 差别 是 账户 -不 活动 字段 : Solaris 
将 其 定义 为 自用 户 上 次 登录 后 到 下 次 账户 自动 失效 之 间 的 天 数 ， 而 
Linux 则 将 其 定义 为 达到 最 大 口令 年 龄 尚 余天 数 。 

在 很 多 系统 中 ， 用 户 和 组 数据 库 是 用 网 络 信 ， 息 服务 (Network 
Information Service，NIS) 实现 的 。 这 使 管理 人 员 可 编辑 数据 库 的 主 副 
A, e e 客户 端 系统 联系 服务 
器 以 查看 用 户 和 组 的 有 关 信息 。NIS+ 和 轻 量 级 目录 访问 协议 























(Lightweight Directory Access Protocol, LDAP) 提供 了 类 似 功能 。 很 
多 系统 通过 配置 文件 /etc/nsswitch.conf 控 制 用 于 管理 每 一 类 信息 的 方 
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6.7 其 他 数据 》 


至 此 仪 讨论 了 两 个 系统 数据 文件 一 一 口令 文件 和 组 文件 。 在 日 常 操 
作 中 ，UNIX 系 统 还 使 用 很 多 其 他 文件 。 例 如 ，BSD 网 络 软件 有 一 个 记 
录 各 网 络 服务 器 所 提供 服务 的 数据 文件 〈/etc/services) ， 有 一 个 记录 协 
议 信 息 的 数据 文件 Cetc/protocols) ， 还 有 一 个 则 是 记录 网 络 信息 的 数 
据 文 件 C/etc/networks) 。 季 和 运 的 是 ， 对 于 这 些 数据 文件 的 接口 都 与 上 
述 对 口令 文件 和 组 文件 的 相似 。 

一 般 情 况 下 ， 对 于 每 个 数据 文件 至 少 有 3 个 函数 。 

(1) get 国 数 : 读 下 一 个 记录 ， 如 果 需 要 ， 还 会 打开 该 文件 。 此 种 
函数 通 稍 返回 指 同 一 个 结构 的 指针 。 当 已 达到 文件 尾 端 时 返回 空 指针 。 
大 多 数 get 函 数 返 回 指 癌 一 个 静态 存储 类 结构 的 指针 ， 如 果 要 保存 其 内 
容 ， 则 需 复 制 它 。 

(2) set PRA: 打开 相应 数据 文件 (如 果 尚 未 打开 〉 » Aa RBZ 
文件 。 如 果 和 硕 望 在 相应 文件 起 始 处 开始 处 理 ， 则 调用 此 函数 。 

(3) end 函 数 : 关闭 相应 数据 文件 。 如 前 所 述 ， 在 结束 了 对 相应 数 
据 文 件 的 读 、 写 操作 后 ， 总 应 调用 此 函数 以 关闭 所 有 相关 文件 。 

男 外 ， 如 果 数 据 文件 支持 某 种 形式 的 键 搜索 ， 则 也 提供 搜索 具有 指 
定 键 的 记录 的 例 程 。 例 如 ， 对 于 口令 文件 ， 提 供 了 两 个 按键 进行 搜索 的 
程序 : getpwnam 寻找 具有 指定 用 户 名 的 记录 ; getpwuid 寻 找 具 有 指定 用 
户 ID 的 记录 。 

图 6-6 中 列 出 了 一 些 这 样 的 例 程 ， 这 些 都 是 UNIX 和 常用 的 。 在 图 中 列 
出 了 针对 口令 文件 和 组 文件 的 函数 ， 这 些 已 在 前 面 说 明 过 。 图 中 也 列 出 
Pi 对 于 图 中 列 出 的 所 有 数据 文件 都 有 get、set 
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/etc/passwd <pwd.h> passwd | getpwnam, getpwuid 
/etc/group <grp.h> group getgrnam, getgrgid 


etc/shadow <shadow.h> | spwd getspnam 





/etc/hosts <netdb.h> hostent | getnameinfo, getaddrinfo 


etc/networks <netdb.h> netent | getnetbyname, getnetbyaddr 


etc/protocols <netdb.h> protoent | Getprotobyname, getprotobynumber 
etc/services <netdb.h> servent | getservbyname, getservbyport 























图 6-6 访问 系统 数据 文件 的 一 些 例 程 
在 Solaris 中 ， 图 6-6 中 的 最 后 4 个 数据 文件 都 是 符号 链接 ， 它 们 都 
链接 到 目录 /etc/inet 下 的 同名 文件 上 。 大 多 数 UNIX 系 统 实现 都 有 类 似 于 
J oe 函数 ， 但 是 这 些 附 加 函数 都 由 在 处 理 系 统管 理 文件 ， 专 
上 实现 


6.8 登录 账户 记录 


大 多 数 UNIX 系 统 都 提供 下 列 两 个 数据 文件 :utmp 文 件 记录 当前 登 
录 到 系统 的 各 个 用 户 ; wtmp 文 件 跟 踪 各 个 登录 和 注销 事件 。 在 V7 中 ， 
每 次 写 入 这 两 个 文件 中 的 是 包含 下 列 结构 的 一 个 二 进 制 记录 : 
struct utmp { 
char ut_line[8]; /* tty line: "ttyhO", "ttyd0", "ttypO", ... */ 
char ut_name[8]; /* login name */ 
long ut_time; /* seconds since Epoch */ 











}; 

登录 时 ，login 程序 填写 此 类 型 结构 ， 然 后 将 其 写 入 到 utmp 文件 
中 ， 同 时 也 将 其 添 写 到 wtmp 文 件 中 。 注 销 时 ，init 进 程 将 utmp 文 件 中 相 
应 的 记录 探 除 〈 每 个 字 贡 都 填 以 null 字 节 ) ， 并 将 一 个 新 记录 添 写 到 
wtmp 文 件 中 。 在 wtmp 文 件 的 注销 记录 中 ，ut_name 字 段 清 除 为 0。 在 系 
统 再 启动 时 ， 以 及 更 改 系统 时 间 和 日 期 的 前 后 ， 都 在 wtmp 文 件 中 追加 
写 特殊 的 记录 项 。who(1) 程 序 读 取 utmp 文 件 ， 并 以 可 读 格 式 打 印 其 内 
来 的 UNIX 版 本 提供 last(1) 命 令 ， 它 读 wtmp 文 件 并 打印 所 选择 的 
记录 。 

大 多 数 UNIX 版 本 仍 提供 utmp 和 wtmp 文 件 ， 但 正如 所 期 望 的 ， 其 中 
的 信息 量 却 增加 了 。YV7 中 写 入 的 20 字 节 的 结构 在 SVR2 中 已 扩充 为 36 字 
节 ， 而 在 SVR4 中 ，utmp 结 构 已 扩充 为 多 于 350 字 节 。 

在 Solaris 中 ， 这 些 记 录 的 详细 格式 请 参见 手册 页 utmpx(4)。Solaris 
10 中 这 两 个 文件 都 在 目录 /vavadm 中 。Solaris 提 供 了 很 多 函数 〈 见 
getutx(3)) 读 或 写 这 两 个 文件 。 

在 FreeBSD ”8.0 和 Linux ” 3.2.0 中， 登录 记录 的 格式 请 参见 手册 页 
utmp(5)。 这 两 个 文件 的 路 径 名 是 /var/run/utmp 和 /var/log/wtmp。 在 Mac 
OS X 10.6.8 中 ，utmp 和 wtmp 文 件 不 存在 。 在 Mac OS X 10.5 中 ，wtmp 文 
件 中 的 信息 可 以 从 系统 登录 工具 中 获得 ，utmpx 文 件 包含 了 活动 的 登录 


会 话 的 信息 。 














6.9 系统 标识 
POSIX.1 定 义 了 了 uname 函数 ， 它 返回 与 主机 和 操作 系统 有 关 的 信 


#include <sys/utsname.h> 
int uname(struct utsname *name); 
返回 值 : A, ESR; Ate, e- 
通过 访 函 数 的 参数 癌 其 传递 一 个 utsname 结构 的 地 址 ， 然 后 该 函数 
填写 此 结构 。POSIX.1 只 定义 了 该 结构 中 最 少 需 提 供 的 字段 〈 它 们 都 是 
字符 数组 ) ， 而 每 个 数组 的 长 度 则 由 实现 确定 。 某 些 实现 在 该 结构 中 提 
供 了 另外 一 些 字段 。 
struct utsname { 
char sysname ]; /* name of the operating system */ 
char nodename[ |; /* name of this node */ 
char release[ ]; /* current release of operating system */ 
char version[ ]; /* current version of this release */ 
char machine[ ]; /* name of hardware type */ 

















F 

每 个 字符 串 都 以 null 字 节 结 尾 。 本 书 讨论 的 4 种 平台 文 持 的 最 大 名 字 
长 度 ( 包 含 终止 null 字 节 ) 列 于 图 6-7 中 。utsname 结 构 中 的 信息 通常 可 
用 uname(1) 命 令 打印 。 

POSIX.1 警 告 nodename 元 素 可 能 并 不 适用 于 在 通信 网 络 上 引用 主 
机 。 此 函数 来 和 目 于 System V， 在 早期 ，nodename 元 素 适 用 于 在 UUCP 网 
络 上 引用 主机 。 

还 要 认识 到 ， 在 此 结构 中 并 没有 给 出 有 关 POSIX.1 版 本 的 信息 。 应 
当 使 用 2.6 节 中 所 说 明 的 _.POSIX_VERSION 获 得 该 信息 。 

最 后 ， 此 函数 只 给 出 了 一 种 获取 该 结构 中 信息 的 方法 ， 人 至 于 如 何 初 
始 化 这 些 信息 ，POSIX.1 没 有 给 出 任何 说 明 。 

历史 上 ，BSD 派 生 的 系统 提供 gethostname 隙 数 ， 它 只 返回 主机 名 ， 
该 名 字 通 常 就 是 TCP/IP 网 络 上 主机 的 名 字 。 

#include <unistd.h> 

int gethostname(char *name, i n t namelen); 

namelen#2248 namek F KK), Wate ewer ala), Wet 











name 返 回 的 字符 串 以 null 字 节 结 尾 。 如 车 没有 提供 足够 的 空间 ， 则 没有 
说 明 通过 name 返 回 的 字符 串 是 否 以 null 结 尾 

现在 ，gethostname 函 数 已 在 POSIX.1 中 定义 ， 它 指定 最 大 主机 名 长 
度 是 HOST_NAME_MAX。 图 6-7 中 总 结 列 出 了 本 书 讨论 的 4 种 实现 支持 
的 最 大 名 字 长 度 





最 大 名 


和 ED == 
FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 





uname 
gethostname 


图 6-7 系统 标识 名 限制 
如 果 和 窒 主 机 联接 到 TCP/IP 网 络 中 ， 则 此 主机 名 通常 是 该 主机 的 完整 


hostname(1) 命 令 可 用 来 获取 和 设置 主机 名 。 超级 用 户 用 一 个 类 似 
的 函数 sethostname 来 设置 主机 名 。) 主机 名 通常 在 系统 自 举 时 设置 ， 它 
由 /etc/rc 或 init 取 自 一 个 局 动 文件 。 





或 名 。 


6.10 时 间 和 日 期 例 程 


由 UNIX 内 核 提 供 的 基本 时 间 服 务 是 计算 自 协调 世界 时 
(Coordinated Universal Time, UTC) 公元 1970 年 1 月 1 日 00:00:00 这 一 特 
定时 间 以 来 经 过 的 秒 数 。1.10 节 中 曾 提 及 这 种 秒 数 是 以 数据 类 型 time t 
表示 的 ， 我 们 称 它 们 为 日 历时 间 。 日 历时 间 包括 时 间 和 日 期 。UNIX 在 
这 方面 与 其 他 操作 系统 的 区 别 是 : (a) 以 协调 统一 时 间 而 非 本 地 时 间 
计时 ;，(b) 可 自动 进行 转换 ， 如 变换 到 夏令 时 ;，(c) 将 时 间 和 日 期 作 
为 一 个 量 值 保 存 。 

time 国 数 返 回 当前 时 间 和 日 期 。 

#include <time.h> 

time_t time(time_t *calptr); 

返回 值 : ERJ, VIII TAME; 知 出 错 ， 返 回 -1 

时 间 值 作为 函数 值 返回 。 如 果 参 数 非 空 ， 则 时 间 值 也 存放 在 由 
calptr 指 同 的 和 单元 内 。 

POSXI.1 的 实时 扩展 增加 了 对 多 个 系统 时 钟 的 文 持 。 在 Single UNIX 
Specification V4 中 ， 控 制 这 些 时 钟 的 接口 从 可 选 组 被 移 至 基本 组 。 时 钟 
通过 clockid_t 类 型 进行 标识 。 图 6-8 给 出 了 标准 值 。 


标识 从 


LOCK REALTIME 灾 时 系统 时 间 
LOCK MONOTONIC POSIX MONOTONIC CLOCK | 不 带 负 跳 数 的 实时 系统 时 间 











C 
: 
CLOCK PROCESS CPUTIME ID | POSIX CPUTIME 调用 进程 的 CPU 时 间 
CLOCK THREAD CPUTIME ID | POSIX THREAD CPUTIME | 调用 线程 的 CPU 时 间 





图 6-8 时 钟 类 型 标识 符 
clock_gettime 函 数 可 用 于 获取 指定 时 钟 的 时 间 ， 返 回 的 时 间 在 4.2 市 
介绍 的 timespec 结 构 中 ， 它 把 时 间 表 示 为 秒 和 纳 秒 。 
#include <sys/time.h> 
int clock_gettime(clockid_t clock_id, struct timespec *tsp); 


返回 值 : ARJ, WO; Aht, e- 


当时 钟 ID 设 置 为 CLOCK_REALTIME 时 ，clock_gettime 函 数 提供 了 
与 time 函 数 类 似 的 功能 ， 不 过 在 系统 文 持 高 精度 时 间 值 的 情况 下 ， 
clock_gettime 可 能 比 time 函 数 得 到 更 高 精度 的 时 间 值 。 
#include <sys/time.h> 
int clock_getres(clockid_t clock_id, struct timespec *tsp); 
返回 值 : AM, WO; AR, eE- 
clock_getres 函 数 把 参数 tsp 指 辐 的 timespec 结 构 初 始 化 为 与 clock_ id 
参数 对 应 的 时 钟 精 度 。 例 如 ， 如 果 精 度 为 1 室 秒 ， 则 tv_sec 字 段 就 是 0， 
tv_nsec* UHL 7E1 000 000. 
要 对 特定 的 时 钟 设置 时 间 ， 可 以 调用 clock_settime 函 数 。 
#include <sys/time.h> 
int clock_settime(clockid_t clock_id, const struct timespec *tsp); 
返回 值 : ERJ, RE; adits, eE- 
我 们 需要 适当 的 特权 来 更 改 时 钟 值 ， 但 是 有 些 时 钟 是 不 能 修改 的 。 
历史 上 ， 在 System ”V 派 生 的 系统 实现 中 ， 调 用 stime(2) 函 数 来 设置 
系统 时 间 ， 而 在 BSD 派 生 的 系统 中 调用 settimeofday(2) 设 置 系 统 时 间 。 
SUSv4 指 定 gettimeofday 函 数 现在 已 弃 用 。 然 和 而， 一些 程 序 仍然 使 用 
这 个 函数 ， 因 为 与 time 函 数 相 比 ，gettimeofday 提 供 了 更 高 的 精度 (可 到 
微 秒 级 ) 。 
#include <sys/time.h> 
int gettimeofday(struct timeval *restrict tp, void *restrict tzp); 
返回 值 : 总 是 返回 0 
tzp 的 唯一 合法 值 是 NULL， 其 他 值 将 产生 不 确定 的 结果 。 某 些 平 台 
文 持 用 tzp 说 明 时 区 ， 但 这 完全 依 实现 而 定 ，Single UNIX Specification 对 
此 并 没有 定义 。 
gettimeofday 函 数 以 距 特定 时 间 (1970 年 1 月 1 日 00 : 00 : 00) 的 秒 数 
的 方式 将 当前 时 间 存 放 在 tp 指向 的 timeval 结 构 中 ， 而 该 结构 将 当前 时 间 
表示 为 秒 和 微 秒 。 
一 旦 取得 这 种 从 上 述 特定 时 间 经 过 的 秒 数 的 整 型 时 间 值 后 ， 通 常 要 
调用 函数 将 其 转换 为 分 解 的 时 间 结 构 ， 然 后 调用 男 一 个 函数 生成 人 们 可 
读 的 时 间 和 日 期 。 图 6-9 说 明了 各 种 时 间 函 数 之 间 的 关系 。【〔 图 中 以 虚 
线 表示 的 3 个 函数 localtime、mktime 和 strftime 都 受到 环境 变量 TZ 的 影 
啊 ， 我 们 将 在 本 市 的 最 后 部 分 对 其 进行 说 明 。 点 划 线 表示 了 如 何 从 时 间 
相关 的 结构 获得 日 历时 间 。) 
两 个 函数 localtime 和 gmtime 将 日 历时 间 转 换 成 分 解 的 时 间 ， 并 将 这 
些 存放 在 一 个 tm 结构 中 。 


struct tm { /* a broken-down time */ 


























int tm_sec; /* seconds after the minute: [0 - 60] */ 


int tm_min; /* minutes after the hour: [0 - 59] */ 
int tm_hour; /* hours after midnight: [0 - 23] */ 

int tm_mday; /* day of the month: [1 - 31] */ 

int tm_mon; /* months since January: [0 - 11] */ 
int tm_year; /* years since 1900 */ 


int tm_wday; /* days since Sunday: [0 - 6] */ 
int tm_yday; /* days since January 1: [0 - 365] */ 
int tm_isdst; /* daylight saving time flag: <0, 0, >0 */ 


}; 

秒 可 以 超过 59 的 理由 是 可 以 表示 润 秒 。 注 意 ， 除 了 月 日 字段 ， 其 他 
字段 的 值 都 以 0 开始 。 如 果 夏 令 时 生效 ， 则 夏令 时 标志 值 为 正 ， 如 果 为 
非 夏令 时 时 间 ， 则 该 标志 值 为 0;， 如 果 此 信息 不 可 用 ， 则 其 值 为 负 。 

Single UNIX Specification 的 以 前 版 本 允许 双 润 秒 ， 于 是 ，tm_sec 值 
的 有 效 范围 是 0 一 61。 

UTC 的 正式 定义 不 允许 双 润 秒 ， 所 以 ， 现 在 tm_sec 值 的 有 效 范 围 定 
义 为 0 一 60。191 


格式 化 字符 串 
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内 核 
图 6-9 各 个 时 间 函 数 之 间 的 关系 





#include <time.h> 

struct tm *gmtime(const time_t *calptr); 

struct tm *localtime(const time_t *calptr); 

两 个 函数 的 返回 值 ， 指 向 分 解 的 tm 结构 的 指针 ， 若 出 错 ， 返 回 NULL 

localtime 和 gmtime 之 间 的 区 别 是 : localtime 将 日 历时 间 转 换 成 本 地 
时 间 《〈 考 虑 到 本 地 时 区 和 夏令 时 标志 ) ， 而 gmtime 则 将 日 历时 间 转 换 
成 协调 统一 时 间 的 年 、 月 、 日 、 时 、 分 、 秒 、 周 日 分 解 结构 。 

函数 mktime 以 本 地 时 间 的 年 、 月 、 日 等 作为 参数 ， 将 其 变换 成 
time_t 值 。 

#include <time.h> 

time_t mktime(struct tm *tmptr); 


返回 值 : ARJ, EIA); 奉 出 错 ， 返 回 -1 





函数 strftime 是 一 个 类 似 于 printf 的 时 间 值 函数 。 它 非常 复杂 ， 可 以 
通过 可 用 的 多 个 参数 来 定制 产生 的 字符 串 。 
#include <time.h> 
size_t strftime(char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr); 
size_t strftime_I(char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr, locale_t locale); 
两 个 函数 的 返回 值 : 大 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 人 否则 ， 返 回 0 
两 个 较 早 的 函数 asctime 和 ctime 能 用 于 产生 一 个 26 字 节 的 可 打 
印 的 字符 串 ， 类 似 于 date(1) 命 令 默 认 的 输出 。 然 而 ， 这 些 函 数 现在 已 经 
被 标 记 为 弃 用 ， 因 为 它们 易 受 到 绥 冲 区 淤 出 问题 的 影响 。 
strftime 1 允许 调用 者 将 区 域 指定 为 参数 ， 除 此 之 外 ，strftime 和 
strftimne_] 函 数 是 相同 的 。strftime 使 用 通过 TZ 环 境 变 量 指定 的 区 域 。 
tmptr 参 数 是 要 格式 化 的 时 间 值 ， 由 一 个 指 问 分 解 时 间 值 tm 结构 的 
虽 针 说 明 。 格 式 化 结果 存放 在 一 个 长 度 为 maxsize 个 字符 的 buf 数 组 中 ， 
如 果 buf 长 度 足 以 存放 格式 化 结果 及 一 个 null 终 止 符 ， 则 该 函数 返回 在 
buf 中 存放 的 字符 数 ( 不 包括 null 终 止 符 ); 否则 该 函数 返回 0。 
format 参 数控 制 时 间 值 的 格式 。 如 同 printf 函 数 一 样 ， 转 换 说 明 的 形 
式 是 百 分 号 之 后 跟 一 个 特定 字符 。format 中 的 其 他 字符 则 按 原 样 输出 。 
两 个 连续 的 百 分 号 在 输出 中 产生 一 个 特 分 号 。 与 printf 函 数 的 不 同 之 处 
是 ， 每 个 转换 说 明 产 生 一 个 不 同 的 定 长 输出 字符 串 ， 在 format 字 符 串 中 
没有 字段 宽度 修饰 符 。 图 6-10 中 列 出 了 37 种 ISO C 规 定 的 转换 说 明 。 
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缩写 的 周 日 名 
全 周 日 名 gee 
缩写 的 月 名 Jan 
全 月 名 January 
日 期 和 时 间 Thu Jan 19 21:24:52 2012 
年 /100 (00~99) 20 
月 日 (01~31) 19 
日 期 (MM/DD/YY) 01/19/12 
月 日 〈 一 位 数字 前 加 空格 ) (1 一 31) 19 
ISO 8601 日 期 格式 (YYYY-MM-DD) 2012-01-19 
ISO 8601 基于 周 的 年 的 最 后 2 位 数 〈00 一 99) 12 
ISO 8601 基于 周 的 年 2012 
与 $b 相同 Jan 
小 时 “(24 小 时 制 ) (00 一 23 ) 21 
小 时 (12 小 时 制 ) (01 一 12) 09 
年 日 001 一 366 ) 019 
月 〈01 一 12) 01 
分 (00~59) 24 
换行 符 
AM/PM PM 
本 地 时 间 (12 小 时 制 ) :24:52 PM 
与 “%H:%M” 相 同 21:24 
秒 : [00-60] 
水 平 制 表 符 
与 “%H:%$M:%S” 相 同 
ISO 8601 周 几 (Monday=1, 1 一 7) 
星期 日 周 数 : 〈00 一 53 ) 03 
ISO 8601 周 数 (01~53) 03 
fal JL: (0=Sunday, 0 一 6) 4 
星期 一 周 数 : 〈00 一 53 ) 03 
本 地 日 期 01/19/12 
本 地 时 间 21:24:52 
年 的 最 后 两 位 数字 (00~99) 12 
年 2012 
ISO 8601 格式 的 UTC 偏 移 量 -0500 
时 区 名 EST 
翻译 为 1 个 % 
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图 6-10 strftime 的 转换 说 明 

图 中 第 3 列 的 数据 来 自 于 在 Mac OS X 中 执行 strftime 函 数 所 得 的 结 
果 ， 它 对 应 的 时 间 和 日 期 是 : Thu Jan 19 21:24:52 EST 2012. 

图 6-10 中 的 大 多 数 格式 说 明 的 意义 很 明显 。 需 要 上 略 做 解释 的 
是 %U、%V 和 %W。%U 是 相应 日 期 在 该 年 中 所 属 周 数 ， 包 含 该 年 中 第 
一 个 星期 日 的 周 是 第 一 周 。%W 也 是 相应 日 期 在 该 年 中 所 属 的 周 数 ， 不 
同 的 是 包含 第 一 个 星期 一 的 周 为 第 一 周 。%V 说 明 符 则 与 上 述 两 者 有 较 
大 区 别 。 如 果 包 含 了 1 月 1 日 的 那 一 周 包含 了 新 一 年 的 4 天 或 更 多 天 ， 那 
么 该 周 是 一 年 中 的 第 一 周 ; 否则 该 周 被 认为 是 上 一 年 的 最 后 一 周 。 在 这 
两 种 情况 下 ， 周 一 都 被 视 作 每 周 的 第 一 天 。 

同 printf 一 样 ，strftime 对 某 些 转换 说 明文 持 修 饰 符 。 可 以 使 用 E 和 O 
修饰 符 产 生 本 地 文 持 的 另 一 种 格式 。 

统 对 strftime 的 format 字 符 串 提供 另 一 些 非 标 准 的 扩充 文 持 。 

SEB 

图 6-11 演 示 了 如 何 使 用 本 章 中 讨论 的 多 个 时 间 函 数 。 特 别 演示 了 如 
何 使 用 strftime 打 印 包 含 当前 日 期 和 时 间 的 字符 串 。 














include <stdio.h> 
tinclude <stdlib.h> 
include <time.h> 


int 

main (void) 

| 
time t t; 
struct tm *tmp; 
char bufl[16]; 
char buf2[64]; 


time (&t) ; 

tmp = localtime (&t) ; 

if (strftime(bufl, 16, "time and date: sr, %a $b Sd, SY", tmp) == 0) 
printf ("buffer length 16 is too small\n"); 

else 
printf("ss\n", bufl); 

if (strftime (buf2, 64, "time and date: Sr, %a $b sd, SY", tmp) == 0) 
printf ("buffer length 64 is too small\n"); 

else 
printf ("$s\n", buf2); 

exit (0) ; 


图 6-11 使 用 strftime 函 数 
回顾 图 6-9 中 的 不 同时 间 函 数 的 关系 。 在 以 人 们 可 读 的 格式 打印 时 
人 
WP: 





$ ./a.out 

buffer length 16 is too small 

time and date: 11:12:35 PM, Thu Jan 19, 2012 

strptime 函 数 是 strftime 的 反 过 来 版 本 ， 把 字符 串 时 间 转 换 成 分 解 时 
间 。 

#include <time.h> 

char *strptime(const char *restrict buf, const char *restrict format, 

struct tm *restrict tmptr); 
返回 值 : TRAE ROSE: I, GKIEINULL 

format 参 数 给 出 了 buf 参 数 指向 的 缓冲 区 内 的 字符 串 的 格式 。 虽 然 与 
stritimerA MLTR lel, (ARR SOUL EAA. strptime rk BFE IR 
说 明 符 列 在 图 6-12 中 。 


缩写 的 或 完整 的 周 日 名 
Sta 相同 
缩写 的 或 完整 的 月 名 

与 $b 相同 

日 期 和 时 间 

年 的 最 后 两 位 数字 

月 日 : [01-31] 

日 期 [MM/DD/YY] 

与 sa 相同 

与 Sb 相同 

小 时 (24 小 时 制 |): [00-23] 
小 时 (12 小 时 制 ): [01-12] 
年 日 : [001-366] 

月 : [01-12] 

分 : [00-59] 

Eara 

AM/PM 

本 地 时 间 : (12 小 时 制 | ) 

与 “%H:%SM” 相 同 

秒 : [00-60] 

任何 空白 

H “SH:3M:3%S” FAA 
星期 日 周 数 : [00-53] 

fi] A: [0=Sunday, 0-6] 
星期 一 周 数 : [00-53] 

本 地 日 期 

本 地 时 间 

年 的 最 后 两 位 数字 : [00-99] 
年 

翻译 为 1 个 % 








图 6-12 strptime 函 数 的 转换 说 明 

我 们 曾 在 前 面 提 及 ， 图 6-9 中 以 虚线 表示 的 3 个 函数 受到 环境 变量 TZ 
的 影响 。 这 3 个 函数 是 localtime、mktime 和 strftime。 如 果 定 义 了 TZ， 则 
这 些 函 数 将 使 用 其 值 代 奉 系 统 默认 时 区 。 如 果 TZ 定义 为 空 串 〈( 即 
TZ=) ， 则 使 用 协调 统一 时 间 UTC。TZ 的 值 常常 类 似 于 TZ=EST5EDT,， 
但 是 POSIX.1 允许 更 详细 的 说 明 。 有 关 TZ 变量 的 详细 情况 ， 请 参阅 
Single UNIX Specification [Open Group 2010] 中 的 环境 变量 人 章节。 

关于 TZ 环 境 变量 的 更 多 信息 可 参见 手册 页 tzset(3)。 








6.11 小 结 


所 有 UNIX 系 统 都 使 用 口令 文件 和 组 文件 。 我 们 说 明了 读 这 些 文件 
的 各 种 函数 。 本 章 也 介绍 了 阴影 口令 ， 它 可 以 增加 系统 的 安全 性 。 附 属 
组 ID 提 供 了 一 个 用 户 同时 可 以 参加 多 个 组 的 方法 。 我 们 还 介绍 了 大 多 数 
系统 所 提供 的 访问 其 他 与 系统 有 关 数 据 文件 的 类 似 函 数 。 我 们 讨论 了 几 
个 POSIX.1 的 系统 标识 函数 ， 应 用 程序 使 用 它们 以 标识 它 在 何 种 系统 上 
运行 。 最 后 ， 说 明了 ISO C 和 Single UNIX Specification 提 供 的 与 时 间 和 
日 期 有 关 的 一 些 函 数 。 


习题 


6.1 如 果 系 统 使 用 阴影 文件 ， 那 么 如 何 取得 加 密 口 令 ? 

6.2 ”假设 你 有 超级 用 户 权 限 ， 并 且 系 统 使 用 了 阴影 口令 ， 重 新 考虑 
上 一 道 习题 。 

6.3 ”编写 一 程序 ， 它 调用 uname 并 输出 utsname 结 构 中 的 所 有 字段 ， 
将 该 输 出 与 name(1) 命 令 的 输出 结果 进行 比较 。 

6.4 计算 可 由 time_t 数 据 类 型 表示 的 最 近 时 间 。 如 果 超 出 了 这 一 时 间 
将 会 如 何 ? 

6.5 编写 一 程序 ， 获 取 当 前 时 间 ， 并 使 用 strftime 将 输出 结果 转换 为 
one date(1) 命 令 的 默认 输出 。 将 环 场 变 量 TZ 设 置 为 不 同 值 ， 观 察 输 

结果 。 








7.1 515 


下 一 章 将 介绍 进程 控制 原 语 ， 在 此 之 前 需 先 了 解 进程 的 环境 。 本 章 
中 将 学 习 : 当 程 序 执行 时 ， 其 main 函 数 是 如 何 被 调用 的 ; 命令 行 参数 是 
如 何 传递 给 新 程序 的 ; 典型 的 存储 空间 布局 是 什么 样式 ， 如 何 分 配 另 外 
的 存储 空间 ;进程 如 何 使 用 环境 变量 ; 进程 的 各 种 不 同 终止 方式 等 。 另 
外 ， 还 将 说 明 longjmp 和 setjmp 函 数 以 及 它们 与 栈 的 交互 作用 。 本 章 结 束 
之 前 ， 还 将 查看 进程 的 资源 限制 。 





7.2 main pki Ži 


C 程 序 总 是 从 main 函 数 开 始 执行 。main 函 数 的 原型 是 : 

int main(int argc, char *argv[]); 

其 中 ，argc 是 命令 行 参数 的 数目 ，argv 是 指向 参数 的 各 个 指针 所 构 
成 的 数组 。7.4 节 将 对 命令 行 参数 进行 说 明 。 

当 内 核 执 行 C 程 序 时 《使 用 一 个 exec 函 数 ，8.10 节 将 说 明 exec 函 
数 ) ， 在 调用 main 前 先 调用 一 个 特殊 的 启动 例 程 。 可 执行 程序 文件 将 此 
局 动 例 程 指定 为 程序 的 起 始 地 址 一 一 这 是 由 连接 编辑 器 设置 的 ， 而 连接 
编辑 器 则 由 C 编 译 费 调用 。 启 动 例 程 从 内 核 取 得 命令 行 参数 和 环境 变量 
值 ， 然 后 为 按 上 述 方式 调用 main 函 数 做 好 安排 。 











7.3 进程 终止 


有 8 种 方式 使 进程 终止 (termination) ， 其 中 5 种 为 正常 终止 ， 它 们 
Æ: (1) 从 main 返 回 ; 

(2) 调用 exit; 

(3) 调用 _exit 或 _Exit; 

(4) 最 后 一 个 线程 从 其 局 动 例 程 返回 〈11.5 节 ) ; 

(5) 从 最 后 一 个 线程 调用 pthread_exit (11.5 节 ) 。 

异常 终止 有 3 种 方式 ， 它 们 是 : 

(6) 调用 abort (10.17 节 ) ; 

(7) 接 到 一 个 信号 (10.2 节 ); 

(8) 最 后 一 个 线程 对 取消 请 求 做 出 啊 应 〈11.5 节 和 12.7 节 ) 。 

在 第 11 音 和 第 12 章 讨论 线程 之 前 ， 我 们 和 暂 不 考虑 专门 针对 线程 的 3 
种 终止 方式 。 

上 节 提 及 的 启动 例 程 是 这 样 编写 的 ， 使 得 从 main 返 回 后 立即 调用 
exit 函 数 。 如 果 将 局 动 例 程 以 C 代 码 形式 表示 《实际 上 该 例 程 稼 常用 汇编 
语言 编写 ) ， 则 它 调 用 main 函 数 的 形式 可 能 是 : 

exit(main(argc, argv)); 

1. 退出 函数 

3 个 函数 用 于 正常 终止 一 个 程序 _exit 和 _Exit 立 即 进入 内 核 ，exit 则 
先 执行 一 些 清理 处 理 ， 然 后 返回 内 核 。 

#include <stdlib.h> 

void exit(int status); 

void _Exit(int status); 

#include <unistd.h> 

void _exit(int status); 

我 们 将 在 8.5 节 中 讨论 这 3 个 函数 对 其 他 进程 〈 如 正在 终止 进程 的 父 
进程 和 子 进程 的 影响 。 

使 用 不 同 头 文件 的 原因 是 exit 和 _Exit 是 由 ISO C 说 明 的 ， 而 _exit 是 由 
POSIX.1 说 明 的 。 

由 于 历史 原因 ，exit 函数 总 是 执行 一 个 标准 IO 库 的 清理 关闭 操 
YE: 对 于 所 有 打开 流 调用 fclose 函 数 。 回 忆 5.5 节 ， 这 造成 输出 缓冲 中 的 
所 有 数据 都 被 冲洗 〈( 写 到 文件 上 ) 。 

3 个 退出 函数 都 带 一 个 整 型 参数 ， 称 为 终止 状态 (或 退出 状态 ，exit 











status) 。 大 多 数 UNIX 系 统 shell 都 提供 检查 进程 终止 状态 的 方法 。 如 果 
Ca) 调用 这 些 函 数 时 不 带 终止 状态 ， 或 Cb) main 执 行 了 一 个 无 返回 值 
的 return 语 句 ， 或 (c) main 没 有 声明 返回 类 型 为 整 型 ， 则 该 进程 的 终止 
状态 是 未 定义 的 。 但 是 ， 帮 main 的 返回 类 型 是 整 型 ， 并 日 main 执 行 到 最 
后 一 条 语句 时 返回 ( 隐 式 返回 ) ， 那 么 该 进程 的 终止 状态 是 0。 

这 种 处 理 是 ISO C 标 准 1999 版 引入 的 。 历 史上 ， 和 若 main 函 数 终止 时 
没有 显 式 使 用 retum 语 句 或 调用 exit 函 数 ， 那 么 进程 终止 状态 是 未 定义 


的 

main 函 数 返回 一 个 整 型 值 与 用 该 值 调用 exit 是 等 价 的 。 于 是 在 main 
函数 中 

exit(0); 

等 价 于 

return(0); 

实例 

图 7-1 中 的 程序 是 经 典 的 “hello, world” 实 例 。 


#include <stdio.h> 


main () 


printf("hello, world\n"); 


























图 7-1 经 典 C 程 序 
对 该 程序 进行 编译 ， 然 后 运行 ， 则 可 见 到 其 终止 码 是 随机 的 。 如 果 
在 不 同 的 系统 上 编译 该 程序 ， 我 们 很 可 能 得 到 不 同 的 终止 码 ， 这 取决 于 
main 函 数 返 回 时 栈 和 寄存 器 的 内 容 : 














$ gcc hello.c 

$ ./a.out 

hello, world 

$ echo $? 打印 终止 状态 

13 

现在 ， 我 们 局 用 1999 ISO C 编 译 器 扩展 ， 则 可 见 到 终止 码 改变 了 : 
$ gcc -std=c99 hello.c 启用 gcc 的 1999 ISO C 扩 展 

$ echo $? 打印 终止 状态 


hello.c:4: warning: return type defaults to 'int' 
$ ./a.out 


hello, world 


0 

注意 ， 当 我 们 启用 1999 ISO C 扩 展 时 ， 编 译 器 发 出 警告 消息 。 打 印 
该 警告 消息 的 原因 是 : main 函 数 的 类 型 没有 显 式 地 声明 为 整 型 。 如 果 我 
们 增加 了 这 一 声明 ， 那 么 此 警告 消息 就 不 会 出 现 。 但 是 ， 如 果 我 们 使 编 
译 堪 所 推荐 的 警告 消息 都 起 作用 《使 用 -Wall 标志 ) ， 则 可 能 见 到 类 似 
于 “control reaches end of nonvoid function.”( 控 制 到 达 非 void 函数 的 尾 
端 ) 这 样 的 警告 消息 。 

将 main 声 明 为 返回 整 型 ， 但 在 main 函 数 体 内 用 exit 代 蔡 return， 对 某 
些 C 编 译 器 和 UNIX lint(1) 程 序 而 言 会 产生 不 必要 的 警告 信息 ， 因 为 这 些 
编译 器 并 不 了 解 main 中 的 exit 与 return 语 句 的 作用 相同 。 避 开 这 种 警告 信 
息 的 一 种 方法 是 在 main 中 使 用 return 语 句 而 不 是 exit。 但 是 这 样 做 的 结果 
是 不 能 用 UNIX 的 grep 实 用 程序 来 找 出 程序 中 所 有 的 exit 调 用 。 男 一 个 解 
决 方法 是 将 main 说 明 为 返回 void 而 不 是 int， 然 后 仍然 调用 exit。 这 样 做 
可 以 避免 编译 器 的 警告 ， 但 从 程序 设计 角度 看 却 并 不 正确 ， 而 且 会 产生 
其 他 的 编译 警告 ， 因 为 main 的 返回 类 型 应 当 是 带 符号 整 型 。 本 章 将 
main 表 示 为 返回 整 型 ， 因 为 这 是 ISO C 和 POSIX.1 所 定义 的 。 

不 同 的 编译 器 产生 警告 消息 的 详细 程度 是 不 一 样 的 。 除 非 使 用 警告 
选项 ， 否 则 GNU C 编 译 吉 不 会 发 出 不 必要 的 警告 消息 。 

下 一 章 我 们 将 了 解 进 程 如 何 造成 程序 被 执行 ， 如 何等 待 进程 完成 ， 
然后 又 如 何 获取 其 终止 状态 。 

2. 函数 atexit 

按照 ISO”C 的 规定 ， 一 个 进程 可 以 登记 多 至 32 个 函数 ， 这 些 函 数 将 
由 exit 自 动 调用 。 我 们 称 这 些 函 数 为 终止 处 理 程序 (exit handler) ， 并 
调用 atexit 函 数 来 登记 这 些 函 数 。 

#include <stdlib.h> 

int atexit(void (*func)(void)); 

BE: AR, Dello; ÆA, EEO 

其 中 ，atexit ”的 参数 是 一 个 函数 地 址 ， 当 调用 此 函数 时 无 需 向 它 传 
递 任 何 参数 ， 也 不 期 望 它 返回 一 个 值 。exit 调 用 这 些 函 数 的 顺序 与 它们 
登记 时 候 的 顺序 相反 。 同 一 函数 如 知 登 记 多 次 ， 也 会 被 调用 多 次 。 

终止 处 理 程序 这 一 机 制 是 由 ANSI C 标 准 于 1989 年 引入 的 。 早 于 
ANSI C 的 系统 ， 如 SVR3 和 4.3BSD， 都 不 提供 这 种 终止 处 理 程序 。 

ISO _C 要 求 ， 系 统 至 少 应 文 持 32 个 终止 处 理 程序 ， 但 实现 经 和 会 提 
供 更 多 的 文 持 〈 人 参见 图 2-15) 。 为 了 确定 一 个 给 定 的 平台 支持 的 最 大 终 
止 处 理 程 序数 ， 可 以 使 用 sysconf 函 数 〈 如 图 2-14 所 示 ) o 

根据 ISO ”C 和 POSIX.1，exit 首 先 调 用 各 终止 处 理 程序 ， 然 后 关闭 























(通过 fclose) 所 有 打开 流 。POSIX.1 扩 展 了 ISO ”CC 标 准 ， 它 说 明 ， 如 若 
程序 调用 exec 函 数 族 中 的 任 一 函数 ， 则 将 清除 所 有 已 安装 的 终止 处 理 程 
序 。 图 7-2 显 示 了 一 个 C 程 序 是 如 何 启动 的 ， 以 及 它 终止 的 各 种 方式 。 


终止 处 理 程序 





AE 








图 7-2 一 个 C 程 序 是 如 何 启动 和 终止 的 
注意 ， 内 核 使 程序 执行 的 唯一 方法 是 调用 一 个 exec 函 数 。 进 程 自愿 
终止 的 唯一 方法 是 显 式 或 隐 式 地 (通过 调用 exit) 调用 _exit 或 _ Exit。 进 
程 也 可 非 目 愿 地 由 一 个 信号 使 其 终止 《图 7-2 中 没有 显示 ) 。 
实例 
图 7-3 的 程序 说 明 如 何 使 用 atexit 函 数 。 








tinclude "apue,h" 


Static void my exitl (void); 
static void my_exit2(void); 


int 
main (void) 
| 
if (atexit (my exit2) != 0) 
err_sys("can't register my_exit2"); 


if (atexit (my exitl) != 0) 

err sys("can't register my exitl"); 
if (atexit(my_exitl) != 0) 

err sys("can't register my exitl"); 


printf ("main is done\n") ; 
return (0) ; 


static void 
my exit] (void) 
| 
printf ("first exit handler\n"); 


static vold 
my exit2 (void) 


printf ("second exit handler\n") ; 














图 7-3 终止 处 理 程序 实例 














执行 该 程序 产生 : 

$ ./a.out 

main is done 

first exit handler 

first exit handler 

Second exit handler 

终止 处 理 程序 每 登记 一 次 ， 就 会 被 调用 一 次 。 在 图 7-3 的 程序 中 ， 
第 一 个 终止 处 理 程序 被 登记 两 次 ， 所 以 也 会 被 调用 两 次 。 注 意 ， 在 main 
中 没有 调用 exit， 而 是 用 了 return 语 人 句 。 


7.4 命令 行 参 数 


当 执 行 一 个 程序 时 ， 调 用 exec 的 进程 可 将 命令 行 参数 传递 给 该 新 程 
序 。 这 是 UNIX shell 的 一 部 分 币 规 操作 。 在 前 几 章 的 很 多 实例 中 ， 我 们 
已 经 看 到 了 这 一 点 。 

实例 

图 7-4 所 示 的 程序 将 其 所 有 命令 行 参数 部 回 显 到 标准 输出 上 。 注 
意 ， 通 第 的 echo(1) 程 序 不 回 显 第 0 个 参数 。 





finclude "apue.h" 


int 
main(int argc, char *argv[]) 
| 


int re 


for (i = 0; 1< argc; i++) echo all command-line args */ 
printf ("arov [$d]: s\n", i, arov[i]); 
exit (0); 





图 7-4 将 所 有 命令 行 参数 回 显 到 标准 输出 

编译 此 程序 ， 并 将 可 执行 代码 文件 命名 为 echoarg， 则 得 到 : 

$ ./echoarg arg1 TEST foo 

argv[0]: ./echoarg 

argv[1]: arg1 

argv[2]: TEST 

argv[3]: foo 

ISO C 和 POSIX.1 都 要 求 argv[argc] 是 一 个 空 指针 。 这 就 使 我 们 可 以 
将 参数 处 理 循环 改写 为 : 

for (i = 0; argv[i] != NULL; i++) 





7.5 环境 表 


每 个 程序 都 接收 到 一 张 环 境 表 。 与 参数 表 一 样 ， 环 境 表 也 是 一 个 字 
符 指 针 数 组 ， 其 中 每 个 指针 包含 一 个 以 null 结 束 的 C 字 符 串 的 地 址 。 全 
局 变量 environ 则 包含 了 该 指针 数组 的 地 址 : 

extern char **environ; 

例如 ， 如 果 该 环境 包含 5 个 字符 串 ， 那 么 它 看 起 来 如 图 7-5 中 所 示 。 
其 中 ， 每 个 字符 串 的 结尾 处 都 显 式 地 有 一 个 null 字 节 。 我 们 称 environ 为 
环境 指针 Cenvironment pointer) ， 指 针 数 组 为 环境 表 ， 其 中 各 指针 指 问 
的 字符 串 为 环境 字符 串 。 


环境 指针 环境 表 a 


environ: — bb HOME=/home/sar\0 


—— PATH=:/bin:/usr/bin\0 





—}_—— SHELL=/bin/bash\0 
—+_—» USER=sar\0 
——_—— LOGNAME=sar\0 


NULL 








图 7-5 由 5 个 字符 串 组 成 的 环境 
按照 惯例 ， 环 境 由 
name = value 
这 样 的 字符 串 组 成 ， 如 图 7-5 中 所 示 。 大 多 数 预 定义 名 完全 由 大 写 
字母 组 成 ， 但 这 只 是 一 个 惯例 。 
在 历史 上 ， 大 多 数 UNIX 系 统 文 持 main 函 数 带 3 个 参数 ， 其 中 第 3 个 
参数 就 是 环境 表 地 址 : 


int main(int argc, char *argv[], char *envp[]); 


因为 ISO C 规 定 main 函 数 只 有 两 个 参数 ， 而 且 第 3 个 参数 与 全 局 变量 
environ 相 比 也 没有 带 来 更 多 益处 ， 所 以 POSIX.1 也 规定 应 使 用 environ 
而 不 使 用 第 3 个 参数 。 通 常用 getenv 和 putenv 函 数 〈 见 7.9 节 ) 来 访问 特 
定 的 环境 变量 ， 而 不 是 用 environ 变 量 。 但 是 ， 如 果 要 查看 整个 环境 ， 则 
必须 使 用 environ 指 针 。 








历史 沿 儿 至今，C 程 序 一 直 由 下 列 几 部 分 组 成 : 

"正文 段 。 这 是 由 CPU 执 行 的 机 器 指令 部 分 。 通 常 ， 正 文 段 是 可 共 
享 的 ， 所 以 即使 是 频繁 执行 的 程序 〈 如 文本 编辑 器 、C 编 译 器 和 shell 
等 ) 在 存储 器 中 也 只 需 有 一 个 副本 ， 男 外 ， 正 文 段 常常 是 只 读 的 ， 以 防 
止 程序 由 于 意外 而 修改 其 指令 。 

“初始 化 数据 段 。 通 常 将 此 段 称 为 数据 段 ， 它 包含 了 程序 中 需 明 确 
地 赋 初 值 的 变量 。 例 如 ， C 程 序 中 任何 函数 之 外 的 声明 : 

int maxcount = 99; 

使 此 变量 以 其 初 值 存放 在 初始 化 数据 段 中 。 

未 初始 化 数据 段 。 通 常 将 此 段 称 为 bss 段 ， 这 一 名 称 来 源 于 早期 汇 
编程 序 一 个 操作 符 ， 意 思 是 “由 符号 开始 的 块 ”(block started by 
symbol) ， 在 程序 开始 执行 之 前 ， 内 核 将 此 段 中 的 数据 初始 化 为 0 或 空 
HET. 函数 外 的 声明 : 

long sum[1000]; 

使 此 变量 存放 在 非 初始 化 数据 段 中 。 

。 栈 。 上 自动 变量 以 及 每 次 函数 调用 时 所 需 保 存 的 信息 都 存放 在 此 段 
中 。 每 次 函数 调用 时 ， 其 返回 地 址 以 及 调用 者 的 环境 信息 《如 某 些 机 器 
寄存 器 的 值 ) 都 存放 在 栈 中 。 然 后 ， 最 近 被 调用 的 函数 在 栈 上 为 其 自动 
和 临时 变量 分 配 存储 空间 。 通 过 以 这 种 方式 使 用 栈 ，C 递 归 函 数 可 以 工 
作 。 递 归 函 数 每 次 调用 自 喘 时 ， 驶 用 一 个 新 的 栈 帧 ， 因 此 一 次 函数 调用 
实例 中 的 变量 集 不 会 影响 男 一 次 函数 调用 实例 中 的 变量 。 

。 推 。 通 党 在 堆 中 进行 动态 存储 分 配 。 由 于 历史 上 形成 的 惯例 ， 堆 
位 于 未 初始 化 数据 段 和 栈 之 间 。 

图 7-6 显示 了 这 些 段 的 一 种 典型 安排 方式 。 这 是 程序 的 逻辑 布局 ， 
虽然 并 不 要 求 一 个 具体 实现 一 定 以 这 种 方式 安排 其 存储 空间 ， 但 这 是 一 
种 我 们 便于 说 明 的 典型 安排 。 对 于 32 位 Intel x86 处 理 器 上 的 Linux, 
正文 段 从 0x08048000 单元 开始 ， 栈 底 则 在 0xC0000000 之 下 开始 《在 这 
种 特定 结构 中 ， 栈 从 高 地 址 向 低地 址 方向 增长 ) 。 扒 顶 和 栈 顶 之 间 未 用 
的 虚 地 址 空间 很 大 。 



































命令 行 参数 
和 环境 变量 
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未 初始 化 的 数据 由 exec 初始 化 
(bss) 为 0 


初始 化 的 数据 
由 exec 从 程序 


图 7-6 典型 的 存储 空间 安排 

a.out 中 还 有 香干 其 他 类 型 的 段 ， 如 包含 符号 表 的 段 、 包 含 调试 信息 
的 段 以 及 包含 动态 共享 库 链 接 表 的 段 等 。 这 些 部 分 并 不 装载 到 进程 执行 
的 程序 映像 中 。 

从 图 7-6 还 可 注意 到 ， 未 初始 化 数据 段 的 内 容 并 不 存放 在 人 磁盘 程序 
文件 中 。 其 原因 是 ， 内 核 在 程序 开始 运行 前 将 它们 都 设置 为 0。 需 要 存 
放 在 磁盘 程序 文件 中 的 段 只 有 正文 段 和 初始 化 数据 段 。 
证 size(1) 命 令 报告 正文 段 、 数 据 段 和 bss 段 的 长 度 〈 以 字 节 为 单位 ) 。 
多 如 : 

$ size /usr/bin/cc /bin/sh 

text data bss dec hex filename 
346919 3576 6680 357175 57337 /usr/bin/cc 

















102134 1776 11272 115182 lclee /bin/sh 
第 4 列 和 第 5 列 是 分 别 以 十 进 制 和 十 六 进 制 表示 的 3 段 总 长 度 。 
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ME, Ke AUNIX RS SCHFES e. Arnold[1986] Wi Y System V 
上 共享 库 的 一 个 早期 实现 ， Gingell [1987] MWH] T SunOS Ena- T 
实现 。 共 享 库 使 得 可 执行 文件 中 不 再 需 Se 而 只 需 在 
所 有 进程 都 可 引用 的 存储 区 中 保存 这 种 库 例 程 的 一 个 副本 。 程 序 第 一 次 
执行 或 者 第 一 次 调用 某 个 库 函 数 时 ， 用 动态 链接 方法 将 程序 与 共 E JE PRI 
数 相 链接 。 这 减少 了 每 个 可 执行 文件 的 长 度 ， 但 增加 了 一 些 运 行 时 间 开 
销 。 这 种 时 间 开 销 发 生 在 该 程序 第 一 次 被 执行 时 ， 或 者 每 个 共享 库 函 数 
第 一 次 被 调用 时 。 共 享 库 的 男 一 个 优点 是 可 以 用 库 函 数 的 新 版 本 代 蔡 老 
版 本 而 无 需 对 使 用 该 库 的 程序 重新 连接 编辑 (假定 参数 的 数目 和 类 型 都 
没有 发 生 改 变 ) 。 

在 不 同 的 系统 中 ， 程 序 可 能 使 用 不 同 的 方法 说 明 是 否 要 使 用 共享 
库 。 比 较 典 型 的 有 cc(1) 和 1d(]) 命 令 的 选项 作为 长 度 方面 发 生变 化 的 
例子 ， 先 用 无 共享 库 方 式 创 建 下 列 可 执行 文件 〈 典 型 的 hello.c 程 序 ) : 





$ gcc -static hello1.c 阻止 gcc 使 用 共享 库 

-TWXIWXI-X 1 sar 879443 Sep 2 10:39 a.out 
text data bss dec hex filename 

787775 6128 11272 805175 c4937 a.out 

$ Is -l a.out 

$ size a.out 


BOR FE ASR SE ee Ss PEE Ae, WUT RAT SCPE IE SCP HE BCH TR 
度 都 显著 减 小 : 


$ gcc hellol.c gcc 默认 使 用 共享 库 
-TWXIWXI-X 1 sar 8378 Sep 2 10:39 a.out 
text data bss dec hex filename 
1176 504 16 1696 6a0 a.out 
$ ls -l a.out 


$ size a.out 


7.8 存储 空间 分 


ISO C 说 明了 3 个 用 于 存储 空间 动态 分 配 的 函数 。 

(1) malloc， 分 配 指定 字 节 数 的 存储 区 。 此 存储 区 中 的 初始 值 不 
确定 。 

(2) calloc， 为 指定 数量 指定 长 度 的 对 象 分 配 存储 空间 。 该 空间 中 
的 每 一 位 bit) 都 初始 化 为 0。 

(3) realloc， 增 加 或 减少 以 前 分 配 区 的 长 度 。 当 增加 长 度 时 ， 可 
能 需 将 以 前 分 配 区 的 内 容 

移 到 另 一 个 足够 大 的 区 域 ， 以 便 在 尾 端 提供 增加 的 存储 区 ， 而 新 增 
区 域内 的 初始 值 则 不 确定 。 

#include <stdlib.h> 

void *malloc(size_t size); 

void *calloc(size_t nobj, size_t size); 

void *realloc(void *ptr, size_t newsize); 

3 个 函数 返回 值 ， 厦 成功， 返回 非 空 指针 ， 奎 出错， 返回 NULL 
void free(void *ptr); 

这 3 个 分 配 函 数 所 返回 的 指针 一 定 是 适当 对 齐 的 ， 使 其 可 用 于 任何 
数据 对 象 。 例 如 ， 在 一 个 特定 的 系统 上 上， 如果 最 苛刻 的 对 齐 要 求 是 ， 
E 
这 X To 

因为 这 3 个 alloc 函数 部 返回 通用 指针 void *， 所 以 如 果 在 程序 中 
包括 了 #include<stdlib.h>〔 以 获得 函数 原型 )， 那 么 当 我 们 将 这 些 函 数 
返回 的 指针 赋予 一 个 不 同类 型 的 指针 时 ， 束 不 需要 显 式 地 执行 强制 类 型 
转换 。 未 声明 函数 的 默认 返回 值 为 int， 所 以 使 用 没有 正确 函数 声明 的 强 
制 类 型 转换 可 能 会 隐藏 系统 错误 ， 因 为 int 类 型 的 长 度 与 函数 返回 类 型 值 
的 长 度 不 同 《〈 本 例 中 是 指针 ) 。 

函数 free 释放 ptr 指 癌 的 存储 空间 。 被 释放 的 空间 通常 被 送 入 可 用 存 
储 区 池 ， 以 后 ， 可 在 调用 上 述 3 个 分 配 函 数 时 再 分 配 。 

realloc 函 数 使 我 们 可 以 增 、 减 以 前 分 配 的 存储 区 的 长 度 《〈 最 种 见 的 
用 法 是 增加 该 区 ) 。 例 如 ， 如 果 先 为 一 个 数组 分 配 存 储 空间 ， 该 数组 长 
FEA 512， 然 后 在 运行 时 填充 它 ， 但 运行 一 段 时 间 后 发 现 该 数组 原先 的 
长 度 不 够 用 ， 此 时 就 可 调用 realloc 扩充 相应 存储 空间 。 如 果 在 该 存储 
区 后 有 尽 够 的 空间 可 供 扩充 ， 则 可 在 原 存储 区 位 置 上 疝 高 地 址 方 同 扩 























充 ， 无 需 移动 任何 原先 的 内 容 ， 并 返回 与 传 给 它 相 同 的 指针 值 。 如 果 在 
原 存 储 区 后 没有 足够 的 空间 ， 则 realloc 分 配 男 一 个 足够 大 的 存储 区 ， 
将 现存 的 512 个 元 素数 组 的 内 容 复制 到 新 分 配 的 存储 区 。 然 后 ， 释 放 原 
存储 区 ， 返 回 新 分 配 区 的 指针 。 因 为 这 种 存储 区 可 能 会 移动 位 置 ， 所 以 
不 应 当 使 任何 指针 指 在 该 区 中 。 习 题 4.16 和 图 C-3 显 示 了 在 getcwd 中 如 何 
使 用 realloc， 以 处 理 任 何 长 度 的 路 径 名 。 图 17-27 的 程序 是 使 用 realloc 的 
另 一 个 例子 ， 用 其 可 以 避免 使 用 编译 时 固定 长 度 的 数组 。 

注意 ，realloc 的 最 后 一 个 参数 是 存储 区 的 新 长 度 ， 不 是 新 、 旧 存储 
区 长 度 之 差 。 作 为 一 个 特例 ， 知 ptr 是 一 个 空 指针 ， 则 realloc 的 功能 与 
malloc 相 同 ， 用 于 分 配 一 个 指定 长 上 度 为 newsize 的 存储 区 。 

这 些 函 数 的 早期 版 本 允许 调用 realloc 分 配 自 上 次 malloc、realloc 或 
calloc 调 用 以 来 所 释放 的 块 。 这 种 技巧 可 回 济 到 V7， 它 利用 malloc 的 搜 
索 策 略 ， 实 现存 储 器 紧缩。Solaris 仍 支持 这 一 功能 ， 而 很 多 其 他 平台 则 
不 支持 。 这 种 功能 不 被 赞同 ， 不 应 再 使 用 。 

这 些 分 配 例 程 通 常用 sbrk(2) 系 统 调用 实现 。 该 系统 调用 扩充 (或 缩 
小 ) 进程 的 堆 ( 见 图 7-6) 。malloc 和 free 的 一 个 样 例 实现 请 见 Kernighan 
和 Ritchie[1988] 的 8.7 节 。 

虽然 sbrk 可 以 扩充 或 缩小 进程 的 存储 空间 ， 但 是 大 多 数 malloc 和 free 
的 实现 都 不 减 小 进程 的 存储 空间 。 释 放 的 空间 可 供 以 后 再 分 配 ， 但 将 它 
们 保持 在 malloc 池 中 而 不 返回 给 内 核 。 

大 多 数 实现 所 分 配 的 存储 空间 比 所 要 求 的 要 稍 大 一 些 ， 额 外 的 空间 
用 来 记录 管理 信息 分 配 块 的 长 度 、 指 癌 下 一 个 分 配 块 的 指针 等 。 这 
了 驶 意味 着 ， 如 果 超 过 一 个 已 分 配 区 的 尾 端 或 者 在 已 分 配 区 起 始 位 置 之 前 
进行 写 操 作 ， 则 会 改写 另 一 块 的 管理 记录 信息 。 这 种 类 型 的 错误 是 灾难 
性 的 ， 但 是 因为 这 种 错误 不 会 很 快 就 暴露 出 来 ， 所 以 也 就 很 难 友 现 。 

在 动态 分 配 的 缓冲 区 前 或 后 进行 写 操 作 ， 破 坏 的 可 能 不 仅仅 是 该 区 
的 管理 记录 信息 。 在 动态 分 配 的 缓冲 区 前 后 的 存储 空间 很 可 能 用 于 其 他 
动态 分 配 的 对 象 。 这 些 对 象 与 破坏 它们 的 代码 可 能 无 关 ， 这 造成 寻求 信 
恩 破 坏 的 源头 更 加 困难 。 

其 他 可 能 产生 的 致命 性 的 错误 是 : 释放 一 个 已 经 释放 了 的 块 ， 调 用 
free 时 所 用 的 指针 不 是 3 个 alloc 函 数 的 返回 值 等 。 如 知 一 个 进程 调用 
malloc 函 数 ， 但 却 未 记 调 用 free 函 数 ， 那 么 该 进程 占用 的 存储 空间 就 会 
连续 增加 ， 这 被 称 为 泄漏 Ceakage) 。 如 果 不 调 用 free 函 数 释放 不 再 使 
用 的 空间 ， 那 么 进程 地 址 空间 长 度 就 会 慢 慢 增加 ， 直 至 不 再 有 空闲 空 
间 。 此 时 ， 由 于 过 度 的 换 页 开销 ， 会 造成 性 能 下 降 。 

因为 存储 空间 分 配 出 错 很 难 跟 踪 ， 所 以 某 些 系统 提供 了 这 些 函 数 的 
男 一 种 实现 版 本 。 每 次 调用 这 3 个 分 配 函 数 中 的 任意 一 个 或 free 时 ， 它 们 





















































都 进行 附加 的 检 错 。 在 调用 连接 编辑 器 时 指定 一 个 专用 库 ， 在 程序 中 整 
可 使 用 这 种 版 本 的 函数 。 此 外 还 有 公共 可 用 的 资源 ， 在 对 其 进行 编译 时 
使 用 一 个 特殊 标志 束 会 使 附加 的 运行 时 检查 生效 。 

FreeBSD. Mac OS X 以 及 Linux 通 过 设置 环境 变量 支持 附加 的 调试 
功能 。 另 外 ， 通 过 符号 链接 /etcmalloc.conf 可 将 选项 传递 给 FreeBSD 函 数 


蔡 代 的 存储 空间 分 配 程序 
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间 分 配 函 数 的 库 。 男 一 些 系统 只 提供 标准 的 存储 空间 分 配 程 序 。 如 果 需 
要 ， 软 件 开 发 者 可 以 下 载 蔡 代 函 数 。 下 面 讨论 某 些 蔡 代 函 数 和 库 。 

1. libmalloc 

基于 SVR4 的 UNIX 系 统 ， 如 Solaries， 包 含 了 libmalloc 库 ， 它 提供 了 
一 套 与 1 SO”C 存 储 空间 分 配 函 数 相 匹 配 的 接口 。libmalloc 库 包括 mallopt 
函数 ， 它 使 进程 可 以 设置 一 些 变 量 ， 并 用 它们 来 控制 存储 空间 分 配 程序 
的 操作 。 还 可 使 用 另 一 个 名 为 mallinfo 的 函数 ， 以 对 存储 空间 分 配 程 序 
的 操作 进行 统计 。 

2. vmalloc 

Vo[1996] 说 明 一 种 存储 空间 分 配 程序 ， 它 允许 进程 对 于 不 同 的 存储 
区 使 用 不 同 的 技术 。 除 了 一 些 vmalloc 特 有 的 函数 外 ， 访 库 也 提供 了 ISO 
C 存 储 空间 分 配 函 数 的 仿真 器 。 

3. quick-fit 

历史 上 所 使 用 的 标准 malloc 算法 是 最 佳 适 配 或 首次 适 配 存 储 分 配 

策略 。quick-fit〈 快 速 适 配 ) 算法 比 上 述 两 种 算法 快 ， 但 可 能 使 用 较 多 

存储 空间 。Weinstock 和 Wulf[1988] 对 该 算法 进行 了 描述 ， 该 算法 基于 将 
存储 空间 分 裂 成 各 种 长 度 的 缓冲 区 ， 并 将 未 使 用 的 缓冲 区 按 其 长 度 组 成 
不 同 的 空 亲 区 列表 。 现 在 许多 分 配 程序 都 基于 快速 适 配 。 

4. jemalloc 

jemalloc 函 数 实现 是 FreeBSD 8.0 中 的 默认 存储 空间 分 配 程序 ， 它 是 
库 函 数 malloc 族 在 FreeBSD 中 的 实现 。 它 的 设计 具有 恨 好 的 可 扩展 性 ， 
可 用 于 多 处 理 器 系统 中 使 用 多 线程 的 应 用 程序 。Evans[2006] 说 明 了 具体 
实现 及 其 性 能 评估 。 

5. TCMalloc 

TCMalloc 函 数 用 于 蔡 代 malloc 函 数 族 以 提供 高 性 能 、 高 扩展 性 和 高 
存储 效率 。 从 高 速 缓存 中 分 配 缓冲 区 以 及 释放 绥 冲 区 到 高 速 缓存 中 时 ， 
它 使 用 线程 -本 地 高 速 缓存 来 避免 锁 开 销 。 它 还 有 内 置 的 堆 检 查 程 序 和 
堆 分 析 程 序 帮助 调试 和 分 析 动 态 存储 的 使 用 。TCMalloc 库 是 开源 可 用 
的 ， 是 Google-perftools 工 具 中 的 一 个 。Ghemawat 和 Menage[2005] 对 此 做 


























了 简单 介绍 。 

6. 函数 alloca 

还 有 一 个 函数 也 值得 一 提 ， 这 就 是 alloca。 它 的 调用 序列 与 malloc 相 
同 ， 但 是 它 是 在 当前 函数 的 栈 帧 上 分 配 存储 空间 ， 而 不 是 在 堆 中 。 其 优 
点 是 : 当 函 数 返回 时 ， 自 动 释放 它 所 使 用 的 栈 帆 ， 所 以 不 必 再 为 释放 空 
间 而 费心 。 其 缺点 是 :alloca 函数 增加 了 栈 帆 的 长 度 ， 而 某 些 系统 在 函 
数 已 被 调用 后 不 能 增加 栈 帧 长 度 ， 于 是 也 就 不 能 支持 alloca 函 数 。 尺 管 
如 此 ， 很 多 软件 包 还 是 使 用 alloca 函 数 ， 也 有 很 多 系统 实现 了 该 函数 。 

本 书 中 讨论 的 4 个 平台 都 提供 了 alloca 函 数 。 








7.9 环境 变量 


如 同 前 述 ， 环 境 字符 串 的 形式 是 : 

name=value 

UNIX 内 核 并 不 查看 这 些 字符 串 ， 它 们 的 解释 完全 取决 于 各 个 应 用 
程序 。 例 如 ，shell 使 用 了 大 量 的 环境 变量 。 其 中 某 一 些 在 登录 时 自动 设 
置 (如 HOME、USER 等 ) ， 有 些 则 由 用 户 设置 。 我 们 通常 在 一 个 shell 
启动 文件 中 设置 环境 变量 以 控制 shell 的 动作 。 例 如 ， 若 设置 了 环境 变量 
MAILPATH， 则 它 告诉 Bourne shell. GNU Bourne-again shell 和 Korn 
shell 到 哪里 去 查看 邮件 。 

ISO C 定 义 了 一 个 函数 getenv， 可 以 用 其 取 环 境 变量 值 ， 但 是 该 标准 
又 称 环境 的 内 容 是 由 实现 定义 的 。 

#include <stdlib.h> 

char *getenv(const char *name); 

返回 值 : 指向 与 name 关 联 的 value 的 指针 ;， 若 未 找到 ， 返 回 NULL 

注意 ， 此 函数 返回 一 个 指针 ， 它 指向 name=value 字 符 串 中 的 value。 

我 们 应 当 使 用 getenv 从 环境 中 取 一 个 指定 环境 变量 的 值 ， 而 不 是 直接 访 
问 environ 。 

Single UNIX Specification 中 的 POSIX.1 定 义 了 某 些 环境 变量 。 如 果 
文 持 XSI 扩 展 ， 那 么 其 中 也 包含 了 另外 一 些 环境 变量 定义 。 图 7-7 列 出 了 
由 Single UNIX _ Specification 定义 的 环境 变量 ， 并 指明 本 书 讨论 的 4 种 实 
现 对 它们 的 支持 情况 。 由 POSIX.1 定 义 的 各 环境 变量 标记 为 *， 人 否则 为 
XSI 扩 展 。 本 书 讨论 的 4 种 UNIX 实 现 使 用 了 很 多 依赖 于 实现 的 环境 变 
量 。 注 意 ，ISO C 没 有 定义 任何 环境 变量 。 
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图 7-7 Single UNIX Specification 定 义 的 环境 变量 


除了 获取 环境 变量 值 ， 有 时 也 需要 设置 环境 变量 。 


我 们 可 能 希望 改 


变现 有 变量 的 值 ， 或 者 是 增加 新 的 环境 变量 。〈 在 下 一 章 将 会 了 解 到 ， 
我 们 能 影响 的 只 是 当前 进程 及 其 后 生成 和 调用 的 任何 子 进程 的 环境 ， 但 
不 能 影响 父 进 程 的 环境 ， 这 通常 是 一 个 shell 进 程 。 尺 省 如 此 ， 修 改 环境 
表 的 能 力 仍然 是 很 有 用 的 。) 遗憾 的 是 ， 并 不 是 所 有 系统 都 文 持 这 种 能 
力 。 图 7-8 列 出 了 由 不 同 的 标准 及 实现 文 持 的 各 种 函数 。 
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getenv 
putenv 
setenv 
unsetenv 








clearenv 





图 7-8 对 于 各 种 环境 表 函 数 的 支持 
clearenv 不 是 Single UNIX Specification 的 组 成 部 分 。 它 被 用 来 删除 
环境 表 中 的 所 有 项 。 在 图 7-8 中 ， 中 间 3 个 函数 的 原型 是 : 
#include <stdlib.h> 
int putenv(char *str); 
函数 返回 值 : 知 成 功 ， 返 回 0; 知 出 错 ， 返 回 非 0 
int setenv(const char *name, const char *value, int rewrite); 
int unsetenv(const char | 
两 个 函数 返回 值 ， 奎 成功， 返回 0; Ab, el- 
这 3 个 函数 的 操作 如 下 。 
“putenv 取 形式 为 naame=value 的 字符 串 ， 将 其 放 到 环境 表 中 。 如 果 
name 已 经 存在 ， 则 先 删除 其 原来 的 定义 。 
“Setenv 将 name 设 置 为 value。 如 果 在 环境 中 name 已 经 存在 ， 那 么 
(a) 若 rewrite 非 0， 则 首先 删除 其 现 有 的 定义 ; (b) 若 rewrite 为 0， 则 
不 删除 其 现 有 定义 (name 不 设置 为 新 的 value， 而 且 也 不 出 错 )。 
“unsetenv 删 除 name 的 定义 。 即 使 不 存在 这 种 定义 也 不 算出 错 
注意 ，putenv 和 setenv 之 间 的 差别 。setenv 必 须 分 配 存 储 空 x 间 ， 以 便 
依据 其 参数 创建 name=value 字 符 串 。putenv 可 以 自由 地 将 传递 给 它 的 参 
数字 符 串 直接 放 到 环境 中 。 确 实 ， 许 多 实现 就 是 这 么 做 的 ， 因 此 ， 将 存 
放 在 栈 中 的 字符 串 作 为 参数 传递 给 putenv 束 会 及 生 错 误 ， 其 原因 是 ， 从 
当前 函数 返回 时 ， 其 栈 帧 占用 的 存储 区 可 能 将 被 重用 。 








这 些 函 数 在 修改 环境 表 时 是 如 何 进行 操作 的 昵 ? 对 这 一 问题 进行 研 
究 、 考 察 是 非常 有 益 的 。 回 忆 图 7-6， 其 中 ， 环 境 表 〈 指 同 实 际 
name=value 字 符 串 的 指针 数组 ) 和 环境 字符 串通 各 存放 在 进程 存储 空间 
的 顶部 〈 栈 之 上 ) 。 删 除 一 个 字符 串 很 简单 只 要 先 在 环境 表 中 找到 
该 指针 ， 然 后 将 所 有 后 续 指 针 都 向 环境 表 首 部 顺 次 移动 一 个 位 置 。 但 是 
增加 一 个 字符 串 或 修改 一 个 现 有 的 字符 串 束 困难 得 多 。 环 境 表 和 环境 字 
符 串 通常 占用 的 是 进程 地 址 空间 的 顶部 ， 所 以 它 不 能 再 向 高 地 址 方向 

CHE) 扩展 : 同时 也 不 能 移动 在 它 之 下 的 各 栈 帧 ， 所 以 它 也 不 能 向 低 
地 址 方 同 〈( 同 下 〉 扩展。 两 者 组 合 使 得 该 空间 的 长 度 不 能 再 增加 。 
(1) 如果 修 改 一 个 现 有 的 name: 

a. 如 果 新 value 的 长 度 少 于 或 等 于 现 有 value 的 长 度 ， 则 只 要 将 新 字 
符 串 复制 到 原 字符 串 所 用 的 空间 中 ; 

b. 如 果 新 value 的 长 度 大 于 原 长 度 ， 则 必须 调用 malloc 为 新 字符 串 
分 配 空间 ， 然 后 将 新 字符 串 复制 到 该 空间 中 ， 接 着 使 环境 表 中 针对 name 
的 指针 指向 新 分 配 区 。 

(2) 如果 要 增加 一 个 新 的 name， 则 操作 束 更 加 复杂 。 首 先 ， 必 须 
调 ds malloc 为 name=value 字 符 串 分 配 空间 ， 然 后 将 该 字符 串 复 制 到 此 空 
间 中 。 

a. 如 果 这 是 第 一 次 增加 一 个 新 name， 则 必须 调用 malloc 为 新 的 指 
针 表 分 配 空间 。 接 着 ， 将 原来 的 环境 表 复 制 到 新 分 配 区 ， 并 将 指 同 新 
name=value 字 符 串 的 指针 存放 在 该 指针 表 的 表 尾 ， 然 后 又 将 一 个 空 指 针 
存放 在 其 后 。 最 后 使 environ 指 癌 新 指针 表 。 再 看 一 下 图 7-6， 如 果 原 来 
的 环境 表 位 于 栈 顶 之 上 (这 是 一 种 常见 情况 ) ， 那 么 必须 将 此 表 移 至 扒 


中 。 
但 是 ， 此 表 中 的 大 多 数 指针 仍 指 同 栈 顶 之 上 的 各 name=value 字 符 


b. 如 果 这 不 是 第 一 次 增加 一 个 新 name， 则 可 知 以 前 已 调用 malloc 
在 堆 中 为 环境 表 分 配 了 空间 ， 所 以 只 要 调用 realloc， 以 分 配 比 原 空间 多 
存放 一 个 指针 的 空间 。 然 后 将 指 问 新 name=value 字 符 串 的 指针 存放 在 该 
表 表 尾 ， 后 面 跟着 一 个 空 指针 。 
































7.10 子 数 setjmp 和 longjmp 


在 C 中 ，goto 语 句 是 不 能 跨越 函数 的 ， 而 执行 这 种 类 型 跳 转 功 能 的 
是 函数 setjmp 和 longjmp。 这 两 个 函数 对 于 处 理发 生 在 很 深层 舱 套 函数 调 
用 中 的 出 错 情况 是 非常 有 用 的 。 

考虑 图 7-9 程 序 的 骨架 部 分 。 其 主 循环 是 从 标准 输入 读 一 行 ， 然 后 
调用 do_line 处 理 该 输入 行 。do_line 函 数 调 用 get_token 从 该 输入 行 中 取 下 
一 个 标记 。 一 行 中 的 第 一 个 标记 假定 是 一 条 某 种 形式 的 命令 ，switch 语 
句 就 实现 命令 选择 。 对 程序 中 示例 的 命令 调用 cmd_add 函 数 。 


finclude "apue ,hy 


tdefine TOKADD 5 


void do line(char *); 
void  cmd_add(void); 
int  get_token(void); 


int 
main(void) 


| 


char line[MAXLINE]; 


while (fgets(line, MAXLINE, stdin) != NULL) 


do line (Line) ; 
exit (0); 


char *tok ptr; 


void 


do_line(char *ptr) 


| 


/* global pointer for get_token() */ 


/* process one line of input */ 


int cmd; 


tok ptr = ptr; 

while ((cmd = get_token()) > 0) { 
switch (cmd) {  /* one case for each command */ 
case TOK ADD: 


cmd_add() ; 
break; 
} 
| 
void 
cmd add (void) 
| 
int token; 


token = get_token(); 
/* rest of processing for this command */ 


int 
get_token (void) 
| 
/* fetch next token from line pointed to by tok ptr */ 








sae 


图 7-9 进行 命令 处 理 程序 的 典型 骨架 部 分 








图 7-9 的 程序 的 骨架 部 分 在 读 命令 、 确 定 命令 的 类 型 ， 然 后 调用 相 
应 函数 处 理 每 一 条 命令 这 类 程序 中 是 非常 典型 的 。 图 7-10 显 示 了 调用 了 
cmd_add 之 后 栈 的 大 致使 用 情况 。 

目 动 变量 的 存储 单元 在 每 个 孔 数 的 栈 桢 中 。 数 组 line 在 main 的 栈 帧 
中 ， 整 型 cmd 在 do_line 的 栈 帧 中 ， 整 型 token 在 cmd_add 的 栈 帧 中 。 

如 上 所 述 ， 这 种 形式 的 栈 安排 是 非常 典型 的 ， 但 并 不 要 求 非 如 此 不 
可 。 栈 并 不 一 定 要 同 低 地 址 方 辐 扩 充 。 某 些 系 统 对 栈 并 没有 提供 特殊 的 
硬件 支持 ， 此 时 一 个 C 实 现 可 能 要 用 链表 实现 栈 帧 。 

在 编写 图 7-9 这 样 的 程序 时 经 常会 过 到 的 一 个 问题 是 ， 如 何 处 理 非 
致命 性 的 错误 。 例 如 ， 若 cmd add 函数 发 现 一 个 错误 〈 比 如 一 个 无 效 的 
数 ) ， 那 么 它 可 能 先 打 印 一 个 出 错 消 息 ， 然 后 忽略 输入 行 的 余下 部 分 ， 
返回 main 函 数 并 读 下 一 输入 行 。 但 是 如 果 这 种 情况 出 现在 main 函 数 中 的 
深层 艇 套 层 中 时 ， 用 C 语 言 难以 做 到 这 一 点 (在 本 例 中 ，cmd_add 函 数 
只 比 main 低 两 个 层次 ， 在 有 些 程序 中 往往 低 5 个 层次 或 更 多 ) 。 如 果 我 
们 不 得 不 以 检查 返回 值 的 方法 逐 层 返回 ， 那 束 会 变 得 很 号 烦 。 
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图 7-10 调用 cmd_add 后 的 各 个 栈 帧 
解决 这 种 问题 的 方法 就 是 使 用 非 局 部 goto 一 一 setjmp 和 longjmp 也 | 
数 。 非 局 部 指 的 是 ， 这 不 是 由 普通 的 C 语 言 goto 语 句 在 一 个 函数 内 实施 
的 跳 转 ， 而 是 在 栈 上 跳 过 知 干 调用 帧 ， 返 回 到 当前 函数 调用 路 径 上 的 某 





一 个 函数 中 。 
#include <setjmp.h> 
int setjmp(jmp_buf env); 
返回 值 : a BRA, 返回 0; 知 从 longjmp 返 回 ， 则 为 非 0 
void longjmp(jmp_buf env, int val); 

在 希望 返回 到 的 位 置 调用 setimp， 在 本 例 中 ， 此 位 置 在 main 函 数 
中 。 因 为 我 们 直接 调用 该 函数 ， 所 以 其 返回 值 为 0。setjmp 参 数 env 的 类 
型 是 一 个 特殊 类 型 jmp_buf。 这 一 数据 类 型 是 某 种 形式 的 数组 ， 其 中 存 
放 在 调用 longjmp 时 能 用 来 恢复 栈 状 态 的 所 有 信息 。 因 为 需 在 另 一 个 函 
数 中 引用 env 变 量 ， 所 以 通常 将 env 变 量 定 义 为 全 局 变量 。 

当 检 得 到 一 个 错误 时 ， 例 如 在 cmd_add 函 数 中 ， 则 以 两 个 参数 调用 
longjmp 函 数 。 第 一 个 就 是 在 调用 setjimp 时 所 用 的 env; 第 二 个 参数 是 具 
非 0 值 的 val， 它 将 成 为 从 setjimp 处 返回 的 值 。 使 用 第 二 个 参数 的 原因 是 
对 于 一 个 setjmp 可 以 有 多 个 longjmp。 例 如 ， 可 以 在 cmd_add 中 以 val 为 1 
调用 longjmp， 也 可 在 get_token 中 以 val 为 2 调用 longjmp。 在 main 函 数 
中 ，setjmp 的 返回 值 束 会 是 1 或 2， 通 过 测试 返回 值 就 可 判断 造成 返回 的 
longjmp 是 在 cmd_add 还 是 在 get_token 中 。 

再 回 到 程序 实例 中 ， 图 7-11 中 给 出 了 经 修改 过 后 的 main 和 cmd_add 
函数 《其 他 两 个 函数 do_line 和 get_token 未 更 改 ) 。 








include "apue.h" 
Hinclude “setjmp,h> 


#define TOK ADD 5 


jmp_buf jmpbuffer; 


int 
main (void) 
| 
char  line(MAXLINE]; 


if (setjmp(jmpbuffer) != 0) 
printf ("error"); 

while (fgets(line, MAXLINE, stdin) != NULL) 
do line (line) ; 

exit (0); 


void 
cmd_add (void) 
{ 


int token; 


token = get_token(); 

if (token < 0) /* an error has occurred */ 
longjmp(jmpbuffer, 1); 

/* rest of processing for this command */ 


图 7-11 setjmp 和 longjmp 实 例 
执行 main 时 ， 调 用 setjmp， 它 将 所 需 的 信息 记 入 变量 jmpbuffer 中 并 
返回 0。 然 后 调用 do_line， 它 又 调用 cmd_add， 假 定 在 其 中 检测 到 一 个 错 
误 。 在 cmd_add 中 调用 lense 之 前 ， 栈 如 图 7-10 中 所 示 。 但 是 
longjmp 使 栈 反 绕 到 执行 main 函 数 时 的 情况 ， 也 就 是 抛弃 了 cmd_add 和 
do_line 的 栈 帧 〈 见 图 7-12) 。 调 用 longjmp 造成 main 中 setjmp 的 返 
回 ， 但 是 ， 这 一 次 的 返 回 值 是 1 (Congjmp 的 第 二 个 参数 ) 。 
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图 7-12 在 调用 longjmp 后 的 栈 帧 

1. 自动 变量 、 和 寄存 器 变量 和 易 失 变量 

我 们 已 经 了 解 在 调用 ”longjmp 后 栈 帧 的 基本 结构 ， 下 一 个 问题 
是 :“ 在 main 函 数 中 ， 目 动 变量 和 寄存 器 变量 的 状态 如 何 ?” ” 当 longjmp 
返回 到 main 冰 数 时 ， 这 些 变量 的 值 是 否 能 恢复 到 以 前 调用 setjmp 时 的 值 
《 即 回 滚 到 原先 值 ) ， 或 者 这 些 变量 的 值 保 持 为 调用 do_line 时 的 值 
(do_line 调 用 cmd_add，cmd_add 又 调用 longjmp) ? 遗憾 的 是 ， 对 此 问 
题 的 回答 是 “看 情况 ”。 大 多 数 实现 并 不 回 滚 这 些 自动 变量 和 寄存 器 变量 
的 值 ， 而 所 有 标准 则 称 它 们 的 值 是 不 确定 的 。 如 果 你 有 一 个 自动 变量 ， 
而 又 不 想 使 其 值 回 深 ， 则 可 定义 其 为 具有 volatile 属 性 。 声 明 为 全 局 变量 
dre nee eon 

KH 

下 面 我 们 通过 图 7-13 程 序 说 明 在 调用 longjmp 后 ， 自 动 变 量 、 全 局 变 
量 、 寄 存 嚣 变量、 静态 变量 和 吻 失 变量 的 不 同情 况 。 
































#include "apue ,hy 
#include <setjmp.h> 


static void fl(int, int, int, int); 
static void f2(void); 


static jmp buf  jmpbuffer; 


static int globval; 
int 
main (void) 
| 
int autoval; 


register int regival; 
volatile int volaval; 
static int statval; 


globval = 1; autoval = 2; regival = 3; volaval = 4; statval = 5; 


if (setjmp(jmpbuffer) != 0) | 
printf ("after longjmp:\n") ; 
printf ("globval = %d, autoval = %d, regival = %d," 
" volaval = %d, statval = $d\n", 
globval, autoval, regival, volaval, statval); 
exit (0); 


/+ 

* Change variables after setjmp, but before longjmp. 
Hf 

globval = 95; autoval = 96; regival = 97; volaval = 98; 
statval = 99; 


fl(autoval, regival, volaval, statval);/* never returns */ 
exit (0); 


static void 
fl(int i, int j, int k, int 1) 
| 
printf ("in f1():\n"); 
printf ("globval = sd, autoval = %d, regival = %d," 
"volaval = $d, statval = $d\n", globval, i, 3, k, 1); 
{2(); 


static void 
£2 (void) 
| 
longjmp (jmpbuffer, 1); 


图 7-13 longjmp 对 各 类 变量 的 影响 


如 果 以 不 帝 优 化 和 融 优 化 选项 对 此 程序 分 别 进行 编译 ， 然 后 运行 
们 ， 则 得 到 的 结果 是 不 同 的 : 

$ gcc testjmp.c 不 进行 任何 优化 的 编译 

$ ./a.out 

in f10): 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 

after longjmp: 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 

$ gcc -O testjmp.c 进行 全 部 优化 的 编译 

$ ./a.out 

in f10): 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 

after longjmp: 

globval = 95, autoval = 2, regival = 3, volaval = 98, statval = 99 

注意 ， 全 局 变量 、 静 态 变量 和 易 失 变量 不 受 优化 的 影响 ， 在 
longjmp 之 后 ， 它 们 的 值 是 最 近 所 呈现 的 值 。 在 某 个 系统 的 setjmp(3) 手 
册页 上 说 明 ， 存 放 在 存储 堪 中 的 变量 将 具有 longjmp 时 的 值 ， 而 在 CPU 
和 浮 点 寄存 器 中 的 变量 则 恢复 为 调用 setjimp 时 的 值 。 这 确实 就 是 运行 图 
7-13 程 序 时 所 观察 到 的 值 。 不 进行 优化 时 ， 所 有 这 5 个 变量 都 存放 在 存 
储 器 中 《〈 即 忽略 了 对 regival 变 量 的 register 存 储 类 说 明 ) 。 而 进行 了 优化 
后 ，autoval 和 regival 都 存放 在 寄存 器 中 《即使 autoval 并 未 说 明 为 
register) ，vVolatile 变 量 则 仍 存 放 在 存储 器 中 。 通 过 这 一 实例 我 们 可 以 理 
解 到 ， 如 果 要 编写 一 个 使 用 非 局 部 跳 转 的 可 移植 程序 ， 则 必须 使 用 
Se ee gee? WEN Ge en ero 
AAE. 

Æ R7-13F, H printf h ENTITE AY Be ANE HEETE 
一 行 中 。 我 们 没有 将 其 分 成 多 个 printf 调 用 ， 而 是 使 用 了 ISO C 的 字符 串 
连接 功能 ， 于 是 两 个 字符 串 序列 

"string1" "string2" 

等 价 于 

"string 1string2" 

第 10 章 讨论 信号 处 理 程序 及 sigsetjmp 和 siglongjmp 时 ， 将 再 次 涉 
及 setjmp Fllongjmp A # 

2. 上 自动 变量 的 潜在 问题 

前 面 已 经 说 明了 处 理 栈 帧 的 一 般 方 式 ， 现在 值得 分 析 一 下 自动 变量 

的 一 个 潜在 出 错 情况 。 基 本 规则 是 声明 自动 变量 的 函数 已 经 返回 后 ， 不 
能 再 引用 这 些 自动 变量 。 在 整个 UNIX 手 册 中 ， 关于 这 一 点 有 很 多 警 



































FE. 
Ho 

图 7-14 中 给 出 了 一 个 名 为 open_data 的 函数 ， 它 打开 了 一 个 标准 IO 
流 ， 然 后 为 该 流 设 置 缓冲 。 


#include <stdio.h> 


FILE * 
open_data (void) 
| 
FILE *fp; 
Char databuf [BUFSIZ]; /* setvbuf makes this the stdio buffer */ 


if ((fp = fopen("datafile", "r")) == NULL) 
return (NULL) ; 

if (setvbuf (fp, databuf, IOLBF, BUFSIZ) != 0) 
return (NULL) ; 

return (fp) ; /* error */ 


图 7-14 自动 变量 的 不 正确 使 用 
问题 是 : 当 open_data 返 回 时 ， 它 在 栈 上 所 使 用 的 空间 将 由 下 一 个 被 
调用 函数 的 栈 帧 使 用 。 人 但是， 标准 IMO 库 函数 仍 将 使 用 这 部 分 存储 空间 
作为 该 流 的 缓冲 区 。 这 就 产生 了 冲突 和 混乱 。 为 了 改正 这 一 问题 ， 应 在 
全 局 存储 空间 静态 地 (如 static 或 extern) 或 者 动态 地 (使 用 一 种 alloc 函 
ŽO 为 数组 databuf 分 配 空间 。 











7.11 Phi ZV getrlimit#!setrlimit 


每 个 进程 都 有 一 组 资源 限制 ， 其 中 一 些 可 以 用 getrlimit 和 setrlimit 函 
数 查 询 和 更 改 。 
#include <sys/resource.h> 
int getrlimit(int resource, struct rlimit *rlptr); 
int setrlimit(int resource, const struct rlimit *rlptr); 
PAS eR SOK IME: FRJ, elo; Aht, eE 
这 两 个 函数 在 Single UNIX Specification 的 XSI 扩 展 中 定义 。 进 程 的 
资源 限制 通常 是 在 系统 初始 化 时 由 0 进程 建立 的 ， 然 后 由 后 续 进 程 继 
承 。 每 种 实现 都 可 以 用 自己 的 方法 对 资源 限制 做 出 调整 。 
对 这 两 个 函数 的 每 一 次 调用 都 指定 一 个 资源 以 及 一 个 指 网 下列 结构 
的 指针 。 
struct rlimit { 
rlim_t rlim_cur; /* soft limit: current limit */ 
rlim_t rlim_max; /* hard limit: maximum value for rlim_cur */ 


} 
在 更 改 资源 限制 时 ， 须 遵循 下 列 3 条 规则 。 
(1) 任何 一 个 进程 都 可 将 一 个 软 限 制 值 更 改 为 小 于 或 等 于 其 硬 限 


制 值 。 

(2) 任何 一 个 进程 都 可 降低 其 硬 限 制 值 ， 但 它 必须 大 于 或 等 于 其 
软 限制 值 。 这 种 降低 ， 对 普通 用 户 而 言 是 不 可 逆 的 。 

(3) 只 有 超级 用 户 进程 可 以 提高 硬 限 制 值 。 

常量 RLIM_INFINITY 指 定 了 一 个 无 限量 的 限制 。 

这 两 个 函数 的 resource 参数 取 下 列 值 之 一 。 图 7-15 显示 哪些 资源 
限制 是 由 Single UNIX Specification 定 义 并 由 本 书 讨论 的 4 种 UNIX 系 统 实 
现 支 持 的 。 
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图 7-15 对 资源 限制 的 支持 

RLIMIT_AS 进程 总 的 可 用 存储 空间 的 最 大 长 度 CF) 。 这 影响 
到 sbrk 函数 〈1.11 节 ) 和 mmap 函 数 (14.877) 。 

RLIMIT_CORE core 文件 的 最 大 字 节 数 ， 知 其 值 为 0 则 阻止 创建 core 
文件 。 

RLIMIT_CPU CPU 时 间 的 最 大 量 值 〈 秒 ) ， 当 超过 此 软 限制 时 ， 辣 
该 进程 发 送 SIGXCPU 信 和 号 。 

RLIMIT_DATA 数据 段 的 最 大 字 市 长 度 。 这 是 图 7-6 中 初始 化 数 
据 、 非 初始 以 及 堆 的 总 和 。 














RLIMIT_FSIZE 可 以 创建 的 文件 的 最 大 字 节 长 度 。 当 超过 此 软 限制 
时 ， 则 向 该 进程 发 送 SIGXFSZ 信 号 。 

RLIMIT_MEMLOCK 一 个 进程 使 用 mlock(2) 能 够 锁定 在 存储 空间 中 
的 最 大 字 节 长 度 。 

RLIMIT MSGQUEUE 进程 为 POSIX 消 息 队 列 可 分 配 的 最 大 存储 字 
节 数 。 

RLIMIT_NICE 为 了 影 啊 进 程 的 调度 优先 级 ，nice 值 (8.16) 可 设 
置 的 最 大 限制 。 

RLIMIT_NOFILE 每 个 进程 能 打开 的 最 多 文件 数 。 更 改 此 限制 将 影 
响 到 sysconf 函 数 在 参数 _ SC_OPEN_MAX 中 返回 的 值 〈 见 2.5.4 节 ) ， 亦 
见 图 2-17。 

RLIMIT_NPROC 每 个 实际 用 户 ID 可 拥有 的 最 大 子 进程 数 。 更 改 此 
限制 将 影响 到 sysconf 函 数 在 参数 _ SC_CHILD_MAX 中 返回 的 值 〈 见 2.5.4 
证 站. 

RLIMIT_NPTS 用 户 可 同时 打开 的 伪 终 端 ( 第 19 章 ) 的 最 大 数量 。 

RLIMIT_RSS 最 大 驻 内 存 集 字 节 长 度 (resident set size in bytes, 
Eo 如 果 可 用 的 物理 存储 器 非常 少 ， 则 内 核 将 从 进程 处 取 回 超过 
RSS 的 部 分 。 

RLIMIT_SBSIZE 在 任 一 给 定时 刻 ， 一 个 用 户 可 以 占用 的 套 接 字 组 
冲 区 的 最 大 长 度 〈 字 节 ) 。 

RLIMIT_SIGPENDING 一 个 进程 可 排队 的 信号 最 大 数量 。 这 个 限制 
是 sigqueue 函 数 实施 的 〈10.20 节 ) 。 

RLIMIT_STACK 栈 的 最 大 字 节 长 度 。 见 图 7-6。 

RLIMIT_SWAP 用 户 可 消耗 的 交换 空间 的 最 大 字 节 数 

RLIMIT_VMEM 这 是 RLIMIT_AS 的 同义词 。 

资源 限制 影响 到 调用 进程 并 由 其 子 进程 继承 。 这 就 意味 着 ， 为 了 影 
啊 一 个 用 户 的 所 有 后 续 进 程 ， 需 将 资源 限制 的 设置 构造 在 shell 之 中 。 确 
S, Bourne shell, GNU Bourne-again shell 和 Korn shell 具 有 内 置 的 ulimit 
MS, C shell 具 有 内 置 limit 命 令 。 (Cumask 和 chdir 函 数 也 必须 是 shell 内 
置 的 。) 

实例 

图 7-16 的 程序 打印 由 系统 文 持 的 所 有 资源 当前 的 软 限制 和 硬 限 制 。 
为 了 在 各 种 实现 上 编译 该 程序 ， 我 们 已 经 条 件 地 包括 了 各 种 不 同 的 资源 
名 。 注 意 ， 有 些 平 台 定义 rlim_t 为 nsigned long long 而 非 unsigned 
long。 在 同一 系统 中 这 个 定义 可 能 也 会 变动 ， 这 取决 于 我 们 在 编译 程序 
候 是 否 文 持 64 位 文件 。 有 些 限 制作 用 于 文件 大 小 ， 因 此 rimt 类 型 必 
须 足够 大 才能 表示 文件 大 小 限制 。 为 了 避免 使 用 错误 的 格式 说 明 而 导致 




















编译 器 警告， 通 第 会 首先 把 限制 复制 到 64 位 整 型 ， 这 样 只 需 处 理 一 种 


格式 。 


finclude "apue ,hn 
include <sys/resource,h> 


define doit(name)  pr_limits(#name, name) 


static void pr_limits(char *, int); 


int 

main (void) 

| 

ifdef RLIMIT AS 
doit (RLIMIT AS) ; 

tendif 


doit (RLIMIT CORE) ; 
doit (RLIMIT CPU) ; 
doit (RLIMIT DATA) ; 
doit (RLIMIT FSIZE) ; 























#iftdetft RLILIMITET MEMILO CK 
Gort] (Gon aE. MEM BB Bp > 
#endif 


#ifdetf RLIMIT_MSGQUEUE 
aot (RLIMETE MSGOUEURBJ > 
#endif 


+#ifdef RLIMIT NICE 
oon ts (ei Ta Ts NITE = 
#endif 


aoe. CREME. DOE STE = 


#iftdet RLIMIT NPROC 
ROLE (RL tM tT PREECE 
#endadift 


Ee RISE NETS 
omni LMES NEESI z 
+#endif 


#ifdet RETMET RSS 
Aono (REYES. RSS} g 
+#endif 


#ifdet REM: CESSEDE 
meas Ces SS Z 
#endif 


+#ifdef RLIMIT_SIGPENDING 
aoit (RLIMIT SIGPENDING) > 
#endif 


doit (RLIMIT STACK 


#ifdef RLIMIT SWAP 
aoit (RLIMIT_ SWAP) 


BU 


H#endif 

#ifdet RLIMIT VMEM 
aout (RLIMIT VMEM) z 

#eondait 


eset COR 


statice eye 
pr_limits (char *name, int resource, 
{ 
SSS. series al hss eg 9 a By ee 
unsigned long long Lrs 


= (gqgetriliimit (resource, &limit) = by) 


err_sys("getrlimit error for ss", name); 
printf("s-14s ", name); 
if (limit.rlim cur == RLIM INFINITY) { 
printf ("(infinite) "); 
} else { 
lim = limit.rlim cur; 
printf ("s1l0lld ", lim); 
| 
if (limit,rlim max == RLIM INFINITY) { 
printf ("(infinite)"); 
} else { 
lim = limit. rlim max; 
printf ("sl011d", lim); 
| 
putchar((int)'\n'); 


图 7-16 打印 当前 资源 限制 
注意 ， 在 doit 宏 中 使 用 了 ISO C 的 字符 串 创建 算 符 GD ， 以 便 为 每 
个 资源 名 产生 字符 串 值 。 例 如 : 
doit(RLIMIT_CORE); 
这 将 由 C 预 处 理 程序 扩展 为 : 
pr_limits("RLIMIT_CORE", RLIMIT_CORE); 
在 FreeBSD 下 运行 此 程序 ， 得 到 : 





$ /a.out 

RLIMIT_AS (infinite) (infinite) 
RLIMIT_CORE (infinite) (infinite) 
RLIMIT_CPU (infinite) (infinite) 

RLIMIT_DATA 536870912 536870912 
RLIMIT_FSIZE (infinite) (infinite) 


RLIMITT_MEMLOCK (infinite) (infinite) 


RLIMIT_NOFILE 3520 3520 


RLIMIT_NPROC 1760 1760 
RLIMIT_NPTS (infinite) (infinite) 
RLIMIT_RSS (infinite) (infinite) 
RLIMIT_SBSIZE (infinite) (infinite) 
RLIMIT_STACK 67108864 67108864 
RLIMIT_SWAP (infinite) (infinite) 


RLIMIT_VMEM (infinite) (infinite) 
在 Solaris 下 运行 此 程序 ， 得 到 : 

$ ./a.out 

RLIMIT_AS (infinite) (infinite) 
RLIMIT_CORE (infinite) (infinite) 
RLIMIT_CPU (infinite) (infinite) 
RLIMIT_DATA (infinite) (infinite) 
RLIMIT_FSIZE (infinite) (infinite) 
RLIMIT_NOFILE 256 65536 
RLIMIT_STACK 8388608 (infinite) 
RLIMIT_VMEM (infinite) (infinite) 
在 介绍 了 信号 机 制 后 ， 习 题 10.11 将 继续 讨论 资源 限制 。 


7.12 小 结 


理解 UNIX 系 统 环境 中 C 程 序 的 环境 是 理解 UNIX 系 统 进程 控制 特性 
的 先决 条 件 。 本 半 说 明了 一 个 进程 是 如 何 启 动 和 终止 的 ， 如 何 回 其 传递 
参数 表 和 环境 。 虽 然 参 数 表 和 环境 都 不 是 由 内 核 进行 解释 的 ， 但 内 核 起 
到 了 从 exec 的 调用 者 将 这 两 者 传递 给 新 进程 的 作用 。 

本 章 也 说 明了 C 程 序 的 典型 存储 空间 布局 ， 以 及 一 个 进程 如 何 动态 
地 分 配 和 释放 存储 空间 。 详 细 地 了 解 用 于 维护 环境 的 一 些 函 数 是 有 意义 
的 ， 因 为 它们 涉及 存储 空间 分 配 。 本 章 也 介绍 了 setimp 和 longjmp PA 
数 ， 它 们 提供 了 一 种 在 进程 内 非 局 部 转移 的 方法 。 最 后 介绍 了 各 种 实现 
提供 的 资源 限制 功能 。 














7.1 ”在 Intel x86 系统 上 ， 使 用 Linux， 如 果 执 行 一 个 输出 “hello， 
world” 的 程序 但 不 调用 exit 或 return， 则 程序 的 返回 代码 为 13( 用 shell 检 
查 ) ， 解 释 其 原因 。 

7.2 图 7-3 中 的 printf 函 数 的 结果 何 时 才 被 真正 输出 ? 

7.3 ”是 否 有 方法 不 使 用 (a) 参数 传递 、(b) 全 局 变量 这 两 种 方 
法 ， 将 main 中 的 参数 argc 和 argv 传 递 给 它 所 调用 的 其 他 函数 ? 

7.4 在 有 些 UNIX 系统 实现 中 执行 程序 时 访问 不 到 其 数据 段 的 0 单 
元 ， 这 是 一 种 有 意 的 安排 ， 为 什么 ? 

7.5 用 C 语 言 的 typedef 为 终止 处 理 程序 定义 了 一 个 新 的 数据 类 型 
Exitfunc， 使 用 该 类 型 修改 atexit 的 原型 。 

7.6 如 果 用 calloc 分 配 一 个 long 型 的 数组 ， 数 组 的 初始 值 是 否 为 0? 如 
果 用 calloc 分 配 一 个 指针 数组 ， 数 组 的 初始 值 是 否 为 空 指针 ? 

Re 在 7.6 闻 结尾 处 size 命 令 的 输出 结果 中 ， 为 什么 没有 给 出 堆 和 栈 
IK? 

7.8 为 什么 7.7 节 中 两 个 文件 的 大 小 〈879 443418 378) 不 等 于 它们 
各 目 文 本 和 数据 大 小 的 和 ? 

7.9 为 什么 7.7 节 中 对 于 一 个 简单 的 程序 ， 使 用 共享 库 以 后 其 可 执行 
文件 的 大 小 变化 如 此 巨大 ? 

7.10 在 7.10 节 中 我 们 已 经 说 明 为 什么 不 能 将 一 个 指针 返回 给 一 个 自 
动 变 量 ， 下 面 的 程序 是 否 正 确 ? 








int 

f1(int val) 

{ 

| 
int num = 0; 
int *ptr = &num; 
if (val == 0) { 
int val; 
val = 5; 
ptr = &val; 
} 


return(*ptr + 1); 


8.1 51 


本 章 介 绍 UNIX 系 统 的 进程 控制 ， 包 括 创建 新 进程 、 执 行程 序 和 进 
程 终止 。 还 将 说 明 进 程 属性 的 各 种 ID 一 实际 、 有 效 和 保存 的 用 户 ID 和 组 
ID， 以 及 它们 如 何 受 到 进程 控制 原 语 的 影响 。 本 章 还 包括 了 解释 器 文件 
和 system 函 数 。 本 章 最 后 讲述 大 多 数 UNIX 系 统 所 提供 的 进程 会 计 机 
制 ， 这 种 机 制 使 我 们 能 够 从 另 一 个 角度 了 解 进程 的 控制 功能 。 


8.2 进程 标识 


每 个 进程 都 有 一 个 非 负 整 型 表示 的 唯一 进程 ID。 因 为 进程 ID 标 识 符 
总 是 唯一 的 ， 第 将 其 用 作 其 他 标识 符 的 一 部 分 以 保证 其 唯一 性 。 例 如 ， 
ID ”作为 名 字 的 一 部 分 来 创建 一 个 唯一 的 文件 


虽然 是 唯一 的 ， 但 是 进程 ID 是 可 复 用 的 。 当 一 个 进程 终止 后 ， 其 进 
程 ID 就 成 为 复 用 的 候选 者 。 大 多 数 UNIX 系统 实现 延迟 复 用 算法 ， 使 得 
赋予 新 建 进程 的 ID 不 同 于 最 近 终 止 进程 所 使 用 的 ID。 这 防止 了 将 新 进 
程 误 认 为 是 使 用 同一 ID 的 某 个 已 终止 的 先前 进程 。 

系统 中 有 一 些 专用 进程 ， 但 具体 细节 随 实 现 而 不 同 。ID 为 0 的 进程 
通 和 是 调度 进程 ， 和 背负 被 称 为 交换 进程 (swapper) 。 该 进程 是 内 核 的 
一 部 分 ， 它 并 不 执行 任何 磁盘 上 的 程序 ， 因 此 也 被 称 为 系统 进程 。 进 程 
ID 1 通常 是 init 进 程 ， 在 自 举 过 程 结束 时 由 内 核 调用 。 该 进程 的 程序 文件 
在 UNIX 的 早期 版 本 中 是 /etc/init， 在 较 新 版 本 中 是 /sbin/init。 此 进程 负责 
在 自 举 内 核 后 启动 一 个 UNIX 系 统 。init 通 常 读 取 与 系统 有 关 的 初始 化 文 
件 Cetc/rc* 文 件 或 /etc/inittab 文 件 ， 以 及 在 /etc/init.d 中 的 文件 ) ， 并 将 系 
统 引 导 到 一 个 状态 (如 多 用 户 ) 。init 进程 决 不 会 终止 。 它 是 一 个 普通 
的 用 户 进程 〈 与 交换 进程 不 同 ， 它 不 是 内 核 中 的 系统 进程 ) ， 但 是 它 以 
本 章 稍 后 部 分 会 说 明 init 如 何 成 为 所 有 孤儿 进程 的 
父 进程 。 

在 Mac OS X 10.4 中 ，initj 进 程 被 launchd 进 程 奉 代 ， 执 行 的 任务 集 与 
init 相 同 ， 但 扩展 了 功能 。 可 参阅 Singh[2006] 在 5.10 节 中 的 讨论 来 了 解 
launchd 是 如 何 操作 的 。 

每 个 UNIX 系 统 实 现 都 有 它 自 己 的 一 套 提供 操作 系统 服务 的 内 核 进 
程 ， 例 如 ， 在 某 些 UNIX 的 虚拟 存储 堪 实 现 中 ， 进 程 ID 2 是 页 守护 进程 

(page daemon) ， 此 进程 负责 支持 虚拟 存储 器 系统 的 分 页 操作 。 

除了 进程 ID， 每 个 进程 还 有 一 些 其 他 标识 符 。 下 列 函 数 返 回 这 些 标 
识 符 。 

#include <unistd.h> 

pid_t getpid(void); 

















返回 值 : 调用 进程 的 进程 ID 
返回 值 : 调用 进程 的 父 进程 ID 


pid_t getppid(void); 


uid_t getuid(void); 
返回 值 : 调用 进程 的 实际 用 户 ID 


返回 值 : 调用 进程 的 有 效用 户 ID 
返回 值 : 调用 进程 的 实际 组 ID 
返回 值 : 调用 进程 的 有 效 组 ID 


注意 ， 这 些 函 数 都 没有 出 错 返 回 ， 在 下 一 节 讨 论 fork 函 数 时 ， 将 进 
一 步 讨 论 父 进程 ID。 在 4.4 节 中 已 讨论 了 实际 和 有 效用 户 ID 及 组 ID。 


uid_t geteuid(void); 
gid_t getgid(void); 


gid_t getegid(void); 


8.3 Pk 2 fork 


一 个 现 有 的 进程 可 以 调用 fork 函 数 创 建 一 个 新 进程 。 

#include <unistd.h> 

pid_t fork(void); 

返回 值 : 子 进程 返回 9， 父 进程 返回 子 进程 ID; Fh, e- 

由 fork 创 建 的 新 进程 被 称 为 子 进程 (child process) 。fork 函 数 被 调 
用 一 次 ， 但 返回 两 次 。 两 次 返回 的 区 别 是 子 进程 的 返回 值 是 0， 而 父 进 
程 的 返回 值 则 是 新 建 子 进程 的 进程 ID。 将 子 进 程 ID 返回 给 父 进程 的 理 
由 是 : 因为 一 个 进程 的 子 进程 可 以 有 多 个 ， 并 且 没 有 一 个 函数 使 一 个 进 
程 可 以 获得 其 所 有 子 进程 的 进程 ID. fork 使 子 进程 得 到 返回 值 0 的 理 
由 是 : 一 个 进程 只 会 有 一 个 父 进程 ， 所 以 子 进程 总 是 可 以 调用 getppid 
以 获得 其 父 进 程 的 进程 ID 〈 进 程 ID 0 总 是 由 内 核 交 换 进 程 使 用 ， 所 以 一 
个 子 进程 的 进程 ID 不 可 能 为 0) 。 

子 进程 和 父 进程 继续 执行 fork 调 用 之 后 的 指令 。 子 进程 是 父 进程 的 
副本 。 例 如 ， 子 进程 获得 父 进程 数据 空间 、 堆 和 栈 的 副本 。 注 意 ， 这 是 
子 进 程 所 拥有 的 副本 。 父 进程 和 子 进程 并 不 共享 这 些 存储 空间 部 分 。 父 
进程 和 子 进程 共享 正文 段 〈 见 7.6 节 ) 。 

由 于 在 fork 之 后 经 党 跟随 着 exec， 所 以 现在 的 很 多 实现 并 不 执行 一 
个 父 进程 数据 段 、 栈 和 堆 的 完全 副本 。 作 为 蔡 代 ， 使 用 了 写 时 复制 
(Copy-On-Write, COW) 技术 。 这 些 区 域 由 父 进程 和 子 进程 共享 ， 而 
且 内 核 将 它们 的 访问 权限 改变 为 只 读 。 如 果 父 进程 和 子 进程 中 的 任 一 个 
试图 修改 这 些 区 域 ， 则 内 核 只 为 修改 区 域 的 那 块 内 存 制作 一 个 副本 ， 通 
常 是 虚拟 存储 系统 中 的 一 “页 ”。Bach[1986] 的 9.2 节 和 ”McKusick 等 [1996] 
的 5.6 节 和 5.7 节 对 这 种 特征 做 了 更 详细 的 说 明 。 

某 些 平台 提供 fork 函数 的 几 种 变 体 。 本 书 讨论 的 4 种 平台 都 支持 下 
节 将 要 讨论 的 vfork(2)。 

Linux 3.2.0 提供 了 男 一 种 新 进程 创建 函数 一 clone(2) 系 统 调用 。 这 
一 种 fork 的 推广 形式 ， 它 允许 调用 者 控制 哪些 部 分 由 父 进程 和 子 进程 


FreeBSD 8.0 提 供 了 rfork(2) 系 统 调用 ， 它 类 似 于 Linux 的 clone 系 统 调 
用 。rfork 调 用 是 从 Plan 9 操作 系统 (Pike 等 [1995]) 派生 出 来 的 。 

Solaris “10 提供 了 两 个 线程 库 : 一 个 用 于 POSIX 线 程 (pthreads) ， 
另 一 个 用 于 Solaris 线 程 。 在 这 两 个 线程 库 中 ，fork 的 行为 有 所 不 同 。 对 




















并 Fim 
向 


于 POSIX 线程 ，fork 创建 一 个 进程 ， 它 仅 包含 调用 该 fork 的 线程 ， 但 对 
于 Solaris 线 程 ，fork 创 建 的 进程 包含 了 调用 线程 所 在 进程 的 所 有 线程 的 
副本 。 在 Solaris 10 中 ， 这 种 行为 改变 了 。 不 管 使 用 哪 种 线程 库 ，fork 创 
建 的 子 进程 只 保留 调用 线程 的 副本 。Solaris 也 提供 了 fork1 函 数 ， 它 创建 
的 进程 只 复制 调用 线程 。 还 有 forkall 函 数 ， 它 创建 的 进程 复制 了 进程 中 
第 11 章 和 第 12 章 将 详细 讨论 线程 。 

SEB 

图 8-1 程 序 演示 了 fork 函 数 ， 从 中 可 以 看 到 子 进 程 对 变量 所 做 的 改变 
并 不 影响 父 进程 中 该 变量 的 值 。 











include "apue.h" 


int globvar = 6; /* external variable in initialized data */ 
char buf[] = "a write to stdout\n"; 


int 

main (void) 

| 
int var; /* automatic variable on the stack */ 
pidt pid; 


var = 88; 

if (write (STDOUT FILENO, buf, sizeof (buf)-1) != sizeof (buf)-1) 
err_sys("write error"); 

printf ("before fork\n"); /* we don't flush stdout */ 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 


} else if (pid == 0) { pS child */ 
globvar++; /* modify variables */ 
vartt} 

} else { 
sleep (2) ; /* parent */ 


printf ("pid = %ld, glob = %d, var = $d\n", (long)getpid(), globvar, 
var); 
exit (0); 





如 果 执 行 此 程序 则 得 到 ; 

图 8-1 fork ek BSE fil] 

$ ./a.out 

a write to stdout 

before fork 

pid = 430, glob = 7, var = 89 子 进 程 的 变量 值 改 变 了 

pid = 429, glob = 6, var = 88 父 进程 的 变量 值 没 有 改变 

$ a.out > temp.out 

$ cat temp.out 

a write to stdout 

before fork 

pid = 432, glob = 7, var = 89 

before fork 

pid = 431, glob = 6, var = 88 

一 般 来 说 ， 在 fork 之 后 是 父 进 程 先 执 行 还 是 子 进程 先 执行 是 不 确定 
的 ， 这 取决 于 内 核 所 使 用 的 调度 算法 。 如 果 要 求 父 进程 和 子 进程 之 间 相 
互 同步 ， 则 要 求 某 种 形式 的 进程 间 通 信 。 在 图 8-1 程 序 中 ， 父 进程 使 目 
己 休 眠 2 s， 以 此 使 子 进程 先 执行 。 但 并 不 保证 2 s 已 经 足够 ， 在 8.9 节 讲 
述 竞 争 条 件 时 还 将 谈 及 这 一 问题 及 其 他 类 型 的 同步 方法 。 在 10.16 市 
中 ， 我 们 将 说 明 在 fork 之 后 如 何 使 用 信号 使 父 进程 和 子 进程 同步 。 

当 写 标准 输出 时 ， 我 们 将 buf 长 度 减 去 1 作为 输出 字 节 数 ， 这 是 为 了 
避免 将 终止 null 字 市 写 出 。strlen 计算 不 包含 终止 null 字 市 的 字符 串 长 
度 ， 而 sizeof 则 计算 包括 终止 null 字 节 的 缓冲 区 长 度 。 两 者 之 间 的 另 一 
个 差别 是 ， 使 用 strlen 需 进 行 一 次 函数 调用 ， 而 对 于 sizeof 而 言 ， 因 为 
绥 冲 区 己 用 已 知 字 符 串 进行 初始 化 ， 其 长 度 是 固定 的 ， 所 以 sizeof 是 在 
编译 时 计算 缓冲 区 长 度 。 

注意 图 8-1 所 示 的 程序 中 fork 与 /0 函数 之 间 的 交互 关系。 回忆 第 3 章 
中 所 述 ，write 函 数 是 不 带 缓 冲 的 。 因 为 在 fork 之 前 调用 write， 所 以 其 数 
据 写 到 标准 输出 一 次 。 但 是 ， 标 准 MJO 库 是 带 缓冲 的 。 回 忆 一 下 5.12 节 ， 
如 果 标 准 输出 连 到 终端 设备 ， 则 它 是 行 缓冲 的 ;否则 它 是 全 绥 冲 的 。 当 
以 交互 方式 运行 该 程序 时 ， 只 得 到 该 printf 输 出 的 行 一 次 ， 其 原因 是 标 
准 输 出 缓冲 区 由 换行 符 冲 洗 。 但 是 当 将 标准 输出 重 定 癌 到 一 个 文件 时 ， 
却 得 到 printf 输 出 行 两 次 。 其 原因 是 ， 在 fork 之 前 调用 了 printf 一 次 ， 但 当 
调用 fork 时 ， 访 行 数据 仍 在 缓冲 区 中 ， 然 后 在 将 父 进程 数据 空间 复制 到 
子 进程 中 时 ， 该 缓冲 区 数据 也 被 复制 到 子 进程 中 ， 此 时 父 进程 和 子 进 程 
各 自 有 了 带 该 行内 容 的 缓冲 区 。 在 exit 之 前 的 第 二 个 printf 将 其 数据 追加 
到 已 有 的 缓冲 区 中 。 当 每 个 进程 终止 时 ， 其 缓冲 区 中 的 内 容 都 被 写 到 相 























应 文件 中 。 

LRF 

对 图 8-1 程 序 需 注 意 的 另 一 点 是 : 在 重 定 向 父 进程 的 标准 输出 时 ， 
子 进程 的 标准 输出 也 被 重 定 同 。 实 际 上 ，fork 的 一 个 特性 是 父 进程 的 所 
有 打开 文件 描述 符 都 被 复制 到 子 进程 中 。 我 们 说 “复制 ?是 因为 对 每 个 文 
件 描述 符 来 说 ， 就 好 像 执 行 了 dup 函 数 。 父 进程 和 子 进 程 每 个 相同 的 打 
开 描 述 符 共享 一 个 文件 表 项 ( 见 图 3-9) 。 

考虑 下 述 情况 ， 一 个 进程 具有 3 个 不 同 的 打开 文件 ， 它 们 是 标准 输 
ee ER 

重要 的 一 点 是 ， 父 进程 和 子 进程 共 至 同一 个 文件 偏 移 量 。 考 虑 下 述 
情况 : 一 个 进程 fork 了 一 个 子 进程 ， 然 后 等 待 子 进程 终止 。 假 定 ， 作 为 
普通 处 理 的 一 部 分 ， 父 进程 和 子 进程 都 癌 标 准 输出 进行 写 操 作 。 如 果 父 
进程 的 标准 输出 已 重 定 同 ( 很 可 能 是 由 shel 实现 的 ) ， 那 么 子 进 程 写 
到 该 标准 得 出 时 ， 它 将 更 新 与 父 进程 共有 的 该 文件 的 偶 移 量 。 在 这 个 例 
子 中 ， 当 父 进程 等 待 子 进程 时 ， 子 进程 写 到 标准 输出 ， 而 在 子 进程 终止 
后 ， 父 进程 也 写 到 标准 输出 上 ， 并 且 知 道 其 输出 会 退 加 在 子 进程 所 写 数 
据 之 后 。 如 果 父 进程 和 子 进程 不 共享 同一 文件 偏 移 量 ， 要 实现 这 种 形式 
的 交互 就 要 困难 得 多 ， 可 能 需要 父 进程 显 式 地 动作 。 
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图 8-2 fork 之 后 父 进程 和 子 进 程 之 间 对 打开 文件 的 共享 

如 果 父 进程 和 子 进程 写 同 一 描述 符 指 同 的 文件 ， 但 又 没有 任何 形式 
的 同步 《如 使 父 进程 等 待 子 进程 ) ， 那 么 它们 的 输出 就 会 相互 混合 《〈 假 
定 所 用 的 描述 符 是 在 fork 之 前 打开 的 ) 。 虽 然 这 种 情况 是 可 能 发 生 的 
( 见 图 8-2〉， 但 这 并 不 是 第 用 的 操作 模式 。 

在 fork 之 后 处 理 文 件 描述 符 有 以 下 两 种 币 见 的 情况 。 

C1) 父 进程 等 待 子 进 程 完 成 。 在 这 种 情况 下 ， 父 进程 无 需 对 其 摘 
述 符 做 任何 处 理 。 当 子 进程 终止 后 ， 它 曾 进 行 过 读 、 写 操作 的 任 一 共享 
描述 符 的 文件 偏 移 量 已 做 了 相应 更 新 。 

(2) 父 进程 和 子 进 程 各 目 执行 不 同 的 程序 段 。 在 这 种 情况 下 ， 在 
fork 之 后 ， 父 进程 和 子 进 程 各 目 关 闭 它 们 不 需 使 用 的 文件 描述 符 ， 这 样 
就 不 会 干扰 对 方 使 用 的 文件 描述 符 。 这 种 方法 是 网 络 服务 进程 经 常 使 用 


的 
除了 打开 文件 之 外 ， 父 进程 的 很 多 其 他 属性 也 由 子 进程 继承 ， 包 

“实际 用 户 ID、 实 际 组 ID、 有 效用 户 ID、 有 效 组 ID 

“附属 组 ID 

“进程 组 ID 

“会话 ID 

“控制 终端 

“设置 用 户 ID 标 志和 设置 组 ID 标志 

。 当 前 工作 目录 

。 根 目录 

“文件 模式 创建 屏蔽 字 

“信号 屏 珊 和 安排 

aa a 

“环境 

“连接 的 共享 存储 段 

“存储 映像 

“资源 限制 

父 进 程 和 子 进程 之 间 的 区 别 具 体 如 下 。 

*fork 的 返回 值 不 同 。 

“进程 ID 不 同 。 

。 这 两 个 进程 的 父 进程 ID 不 同 : 子 进程 的 父 进程 ID 是 创建 它 的 进程 
的 ID， 而 父 进程 的 父 进程 ID 则 不 变 。 

* 子 进程 的 tms_utime、tms_stime、tms_cutime 和 tms_ustime 的 值 设 置 
为 0〈 这 些 时 间 将 在 8.17 节 中 介绍 ) 。 





























* 子 进程 不 继承 父 进程 设置 的 文件 锁 。 

。 子 进程 的 未 处 理 曾 钟 被 清除 。 

* 子 进程 的 未 处 理 信号 集 设置 为 空 集 。 

其 中 很 多 特性 至 今 尚 未 讨论 过 ， 我 们 将 在 以 后 几 章 中 对 它们 进行 说 
HA o 

使 fork 失 败 的 两 个 主要 原因 是 : a) 系统 中 已 经 有 了 太 多 的 进程 
(通常 意味 着 某 个 方面 出 了 问题 ) ， b) 该 实际 用 户 ID 的 进程 总 数 超 
过 了 系统 限制 。 回 忆 图 2-11， 其 中 CHILD_MAX 规 定 了 每 个 实际 用 户 ID 
在 任 一 时 刻 可 拥有 的 最 大 进程 数 。 

fork 有 以 下 两 种 用 法 。 

(1) 一 个 父 进程 希望 复制 自己 ， 使 父 进 程 和 子 进程 同时 执行 不 同 
的 代码 段 。 这 在 网 络 服务 进程 中 是 常见 的 一 父 进 程 等 待 客户 端的 服务 请 
求 。 当 这 种 请 求 到 达 时 ， 父 进程 调用 fork， 使 子 进程 处 理 此 请 求 。 父 进 
程 则 继续 等 待 下 一 个 服务 请 求 。 

(2) 一 个 进程 要 执行 一 个 不 同 的 程序 。 这 对 shell 是 常见 的 情况 。 
在 这 种 情况 下 ， 子 进程 从 fork 返 回 后 立即 调用 exec“〈 我 们 将 在 8.10 节 说 
明 exec) 。 

某 些 操作 系统 将 第 2 种 用 法 中 的 两 个 操作 (fork 之 后 执行 exec) 组 
合成 一 个 操作 ， 称 为 spawn。UNIX 系 统 将 这 两 个 操作 分 开 ， 因 为 在 很 多 
场合 需要 单独 使 用 fork， 其 后 并 不 跟随 exec。 另 外 ， 将 这 两 个 操作 分 
开 ， 使 得 子 进程 在 fork 和 exec 之 间 可 以 更 改 上 自己 的 属性 ， 如 IO 重 定 同 、 
用 户 ID、 信 号 安排 等 。 在 第 15 章 中 有 很 多 这 方面 的 例子 。 

Single UNIX Specification 在 高 级 实时 选项 组 中 确实 包括 了 spawn 接 
口 。 但 是 该 接口 并 不 想 蔡 换 fork 和 exec。 它 们 的 目的 是 支持 难于 有 效 实 
现 fork 的 系统 ， 特 别 是 对 存储 管理 缺少 硬件 文 持 的 系统 。 

















8.4 pki 2 vfork 


vfork ek 8 AY vil FA AP A VE SG forki IA], (APT ia SCA E. 

vfork 起 源 于 较 早 的 2.9BSD。 有 些 人 认为 ， 该 函数 是 有 瑕 疲 的 。 但 
是 本 书 讨论 的 4 种 平台 都 支持 它 。 事 实 上 ，BSD 的 开发 者 在 4.4BSD 中 
删除 了 该 函数 ， 但 4.4BSD 派生 的 所 有 开放 源码 BSD 版 本 又 将 其 收回 。 
在 SUSv3 中 ，vfork 被 标记 为 弃 用 的 接口 ， 在 SUSv4 中 被 完全 删除 。 我 们 
eee 可 移植 的 应 用 程序 不 应 该 使 用 
这 个 函数 。 

Vvfork 函 数 用 于 创建 一 个 新 进程 ， 而 该 新 进程 的 目的 是 exec 一 个 新 程 
序 〈( 如 上 一 节 末 尾 的 (2〉 中 一 样 )。 图 1-7 程 序 中 的 shell 基 本 部 分 就 是 
这 类 程序 的 一 个 例子 。vfork 与 fork 一 样 都 创建 一 个 子 进程 ， 但 是 它 并 不 
将 父 进程 的 地 址 空间 完全 复制 到 子 进程 中 ， 因 为 子 进程 会 立即 调用 
exec( 或 exit) ， 于 是 也 就 不 会 引用 该 地 址 空间 。 不 过 在 子 进程 调用 exec 
或 exit 之 前 ， 它 在 父 进程 的 空间 中 运行 。 这 种 优化 工作 方式 在 某 些 UNIX 
系统 的 实现 中 提高 了 效率 ， 但 如 果子 进程 修改 数据 《〈 除 了 用 于 存放 vfork 
返回 值 的 变量 ) 、 进 行 函数 调用 、 或 者 没有 调用 exec 或 exit 就 返回 都 
可 能 会 带 来 未 知 的 结果 。“【 束 像 上 一 节 中 提 及 的 ， 实 现 采 用 写 时 复制 技 
ee 但 是 不 复制 比 部 分 复制 还 是 要 
快 一 些 。) 

vfork 和 fork 之 间 的 另 一 个 区 别 是 : vfork 保 证 子 进程 先 运行 ， 在 它 调 
用 exec 或 exit 之 后 父 进 程 才 可 能 被 调度 运行 ， 当 子 进程 调用 这 两 个 函数 
中 的 任意 一 个 时 ， 父 进程 会 恢复 运行 。〈 如 果 在 调用 这 两 个 函数 之 前 子 
C ee ene 则 会 导致 死 锁 。) 

SEB 

图 8-3 中 的 程序 是 图 8-1 中 的 程序 的 修改 版 ， 其 中 用 vfork 代 奉 了 
fork， 删 除了 对 于 标准 输出 的 write 调用 。 另 外 ， 我 们 也 不 再 需要 让 父 进 
程 调用 sleep， 因 为 我 们 可 以 保证 ， 在 子 进程 调用 exec 或 exit 之 前 ， 内 核 
会 使 父 进程 处 于 休眠 状态 。 


























finclude "apue ,hn 


int globvar = 6; /* external variable in initialized data */ 


int 

main (void) 

| 
int var;  /* automatic variable on the stack */ 
pidt pid; 


var = 88; 
printf ("before vfork\n"); /* we don't flush stdio */ 
if ((pid = vfork()) < 0) | 

err sys("vfork error"); 


} else if (pid == 0) | /* child */ 
globvart+; /* modify parent's variables */ 
Vartt; 
exit (0); /* child terminates */ 


/* parent continues here */ 

printf ("pid = $ld, glob = $d, var = $d\n", (long)getpid(), globvar, 
var); 

exit (0); 


图 8-3 vfork 函 数 实例 





运行 该 程序 得 到 : 

$.la.out 

before vfork 

pid = 29039, glob = 7, var = 89 

子 进程 对 变量 做 增 1 的 操作 ， 结 果 改 变 了 父 进程 中 的 变量 值 。 因 为 
子 进 程 在 父 进程 的 地 址 空间 中 运行 ， 所 以 这 并 不 令 人 惊讶 。 但 是 其 作用 
的 确 与 fork 不 同 。 

注意 ， 在 图 8-3 程 序 中 ， 调 用 了 _exit 而 不 是 exit。 正 如 7.3 节 所 述 ， 
_exit 并 不 执行 标准 WO 绥 冲 区 的 冲洗 操作 。 如 果 调 用 的 是 exit 而 不 是 
_exit， 则 该 程序 的 输出 是 不 确定 的 。 它 依赖 于 标准 WO 库 的 实现 ， 我 们 
Pa 出 没有 发 生变 化 ， 或 者 发 现 没有 出 现 父 进 程 的 printf 输 


如 果子 进程 调用 exit， 实 现 冲洗 标准 VO 流 。 如 果 这 是 函数 库 采 取 
的 唯一 动作 ， 那 么 我 们 会 见 到 这 样 操作 的 输出 与 子 进程 调用 _exit 所 产生 
的 输出 完全 相同 ， 没 有 任何 区 别 。 如 果 该 实现 也 关闭 标准 IO 流 ， 那 么 
表示 标准 输出 FILE 对 象 的 相关 存储 区 将 被 清 0。 因 为 子 进 程 借用 了 父 进 
程 的 地 址 空间 ， 所 以 当 父 进程 恢复 运行 并 调用 printf 时 ， 也 就 不 会 产生 
任何 输出 ，printf 返 回 -1。 注 意 ， 父 进程 的 STDOUT_FILENO 仍 然 有 
效 ， 子 进程 得 到 的 是 父 进程 的 文件 描述 符 数 组 的 副本 (参见 图 8-2)。 

大 多 数 exit 的 现代 实现 不 再 在 流 的 关闭 方面 自 找 麻烦 。 因 为 进程 即 
将 终止 ， 那 时 内 核 将 关闭 在 进程 中 已 打开 的 所 有 文件 描述 符 。 在 库 中 关 
闭 这 些 ， 只 是 增加 了 开销 而 不 会 带 来 任何 益处 。 

MCKusick 等 [1996] 的 5.6 节 中 包含 了 fork 和 vfork 实 现 方面 的 更 多 信 
尽 。 习 题 8.1 和 习题 8.2 将 继续 对 vfork 进 行 讨论 。 














8.5 Pk BVexit 


如 7.3 节 所 述 ， 进 程 有 5 种 正常 终止 及 3 种 异常 终止 方式 。5 种 正常 终 
止 方式 具体 如 下 。 

(1) 在 main 函 数 内 执行 return 语 句 。 如 在 7.3 节 中 所 述 ， 这 等 效 于 调 
用 exit。 

(2) 调用 exit 函 数 。 此 函数 由 ISO ”C 定 义 ， 其 操作 包括 调用 各 终止 
处 理 程序 (终止 处 理 程序 在 调用 atexit 函 数 时 登记 ) ， 然 后 关闭 所 有 标 
准 1/O 流 等 。 因 为 I SO  C 并 不 处 理 文件 描 述 符 、 多 进程 ( 父 进程 和 子 进 
程 ) 以 及 作业 控制 ， 所 以 这 一 定义 对 UNIX 系 统 而 言 是 不 完整 的 。 

(3) 调用 _exit 或 _Exit 函 数 。ISOC 定 义 _Exit， 其 目的 是 为 进程 提供 
一 种 无 需 运 行 终止 处 理 程序 或 信号 处 理 程序 而 终止 的 方法 。 对 标准 LO 
流 是 否 进行 冲洗 ， 这 取决 于 实现 。 在 UNIX 系统 中 ，_Exit 和 _exit 是 同 
义 的 ， 并 不 冲洗 标准 IO 流 。_exit 函数 由 exit 调用 ， 它 处 理 UNIX 系 统 
特定 的 细节 。_exit 是 由 POSIX.1 说 明 的 。 

在 大 多 数 UNIX 系 统 实现 中 ，exit(3) 是 标准 C 库 中 的 一 个 函数 ， 而 
_exit(2) 则 是 一 个 系统 调用 。 

(4) 进程 的 最 后 一 个 线程 在 其 启动 例 程 中 执行 return 语 句 。 但 是 ， 
该 线程 的 返回 值 不 用 作 进 程 的 返回 值 。 当 最 后 一 个 线程 从 其 局 动 例 程 返 
回 时 ， 该 进程 以 终止 状态 0 返回 。 

(5) 进程 的 最 后 一 个 线程 调用 pthread_exit 函数 。 如 同 前 面 一 样 ， 
在 这 种 情况 中 ， 进 程 终止 状态 总 是 0， 这 与 传送 给 pthread_exit 的 参数 无 
关 。 在 11.5 节 中 ， 我 们 将 对 pthread_exit 做 更 多 说 明 。 

3 种 异常 终止 具体 如 下 。 

(1) 调用 abort。 它 产生 SIGABRT 信 号 ， 这 是 下 一 种 异常 终止 的 一 
种 特例 。 

(2) 当 进 程 接 收 到 某 些 信号 时 。 (第 10 章 将 较 详 细 地 说 明 信 
号 。) 信号 可 由 进程 自身 〈 如 调用 abort 函 数 ) 、 其 他 进程 或 内 核 产 生 。 
例如 ， 若 进程 引用 地 址 空间 之 外 的 存储 单元 、 或 者 除 以 0， 内 核 就 会 为 
该 进程 产生 相应 的 信号 。 

(3) 最 后 一 个 线程 对 “取消 ”(cancellation) 请 求 作 出 响应 。 默 认 
情况 下 , “取消 ”以 延迟 方式 发 生 : 一 个 线程 要 求 取 消 另 一 个 线程 ， 若 干 
时 间 之 后 ， 目 标 线程 终止 。 在 11.5 节 和 12.7 节 ， 我 们 将 详细 讨论 “ 取 


消 * 请 求 。 











不 管 进 程 如 何 终止 ， 最 后 都 会 执行 内 核 中 的 同一 段 代 码 。 这 段 代 码 
为 相应 进程 关闭 所 有 打开 描述 符 ， 释 放 它 所 使 用 的 存储 器 等 。 

对 上 述 任意 一 种 终止 情形 ， 我 们 都 希望 终止 进程 能 够 通知 其 父 进 程 
它 是 如 何 终 止 的 。 对 于 ”3 个 终止 函数 (exit、_exit 和 _Exit) ， 实 现 这 一 
点 的 方法 是 ， 将 其 退出 状态 (exit status) 作为 参数 传送 给 函数 。 在 异常 
终止 情况 ， 内 核 〈 不 是 进程 本 身 ) 产生 一 个 指示 其 异常 终止 原因 的 终止 
状态 (termination status) 。 在 任意 一 种 情况 下 ， 该 终止 进程 的 父 进程 都 
能 用 wait 或 waitpid 函 数 〈 将 在 下 一 节 说 明 ) 取得 其 终止 状态 。 

注意 ， 这 里 使 用 了 “退出 状态 ”( 它 是 传递 给 向 3 个 终止 函数 的 参 
数 ， 或 main 的 返回 值 ) 和 “终止 状态 ”两 个 术语 ， 以 表示 有 所 区 别 。 在 最 
后 调用 _exit 时 ， 内 核 将 退出 状态 转换 成 终止 状态 (回忆 图 7-2) 。 图 8-4 
说 明 父 进程 检查 子 进程 终止 状态 的 不 同方 法 。 如 果子 进程 正常 终止 ， 则 
父 进程 可 以 获得 子 进程 的 退出 状态 。 

在 说 明 fork 函 数 时 ， 显 而 易 见 ， 子 进程 是 在 父 进 程 调 用 fork 后 生成 
的 。 上 面 又 说 明了 子 进程 将 其 终止 状态 返回 给 父 进程 。 但 是 如 果 父 进程 
在 子 进 程 之 前 终止 ， 又 将 如 何 呢 ? 其 回答 是 : 对 于 父 进程 已 经 终止 的 所 
有 进程 ， 它 们 的 父 进 程 都 改变 为 init 进程 。 我 们 称 这 些 进程 由 init 进 程 
收养 。 其 操作 过 程 大 臻 是: 在 一 个 进程 终止 时 ， 内 核 逐 个 检查 所 有 活动 
进程 ， 以 判断 它 是 否 是 正 要 终止 进程 的 子 进 程 ， 如 果 是 ， 则 该 进程 的 父 
人 
> SORERE 

另 一 个 我 们 关心 的 情况 是 ， 如 果子 进程 在 父 进程 之 前 终止 ， 那 么 父 
进程 又 如 何 能 在 做 相应 检查 时 得 到 子 进 程 的 终止 状态 呢 ? 如 果子 进程 完 
全 消失 了 ， 父 进程 在 最 终 准 备 好 检查 子 进程 是 否 终止 时 是 无 法 获取 它 的 
终止 状态 的 。 内 核 为 每 个 终止 子 进程 保存 了 一 定量 的 信息 ， 所 以 当 终 止 
进程 的 父 进程 调用 wait 或 waitpid 时 ， 可 以 得 到 这 些 信 息 。 这 些 信 息 至 少 
包括 进程 ID、 该 进程 的 终止 状态 以 及 该 进程 使 用 的 CPU 时 间 总 量 。 内 核 
可 以 释放 终止 进程 所 使 用 的 所 有 存储 区 ， 关 闭 其 所 有 打开 文件 。 在 
UNIX ”术语 中 ， 一 个 已 经 终止 、 但 是 其 父 进 程 尚 未 对 其 进行 善后 处 理 
(获取 终止 子 进程 的 有 关 人 信息、 释放 它 仍 占用 的 资源 ) 的 进程 被 称 为 僵 
死 进 程 (zombie) 。ps(1) 命 令 将 伪 死 进程 的 状态 打印 为 Z。 如 果 编 写 一 
个 长 期 运行 的 程序 ， 它 fork 了 很 多 子 进程 ， 那 么 除非 父 进 程 等 等 取 得 子 
进程 的 终止 状态 ， 不 然 这 些 子 进程 终止 后 就 会 变 成 僵 死 进程 。 

236 
: 某 些 系统 提供 了 一 种 避免 产生 僵 死 进程 的 方法 ， 这 将 在 10.7 中 介 


最 后 一 个 要 考虑 的 问题 是 ， 一 个 由 init 进 程 收 养 的 进程 终止 时 会 发 





























EIA? 后 会 不 会 变 成 一 个 僵 死 进程 ? 对 此 问题 的 回答 是 “ 否 ”， 因 为 
init 和 被 编写 成 无 论 何 时 只 要 有 一 个 子 进程 终止 ， init 就 会 调用 一 个 wait 
图 数 取得 其 终止 状态 。 这 样 也 就 防止 了 在 系统 中 穴 满 僵 死 进程 。 当 提 
及 “一 个 init 的 子 进程 时 ， 这 指 的 可 能 是 init 直 接 产 生 的 进程 (如 将 在 9.2 
节 资 明 的 getty 进 程 )》 ， 也 可 能 是 其 父 进 程 已 终止 ， 由 init 收 养 的 进程 。 











8.6 Pl 2 wait waitpid 


| —/MEEREIE fs BE REIN, APA SHER RIA SIGCHLD 
信号 。 因 为 子 进程 终止 是 个 异步 事件 〈 这 可 以 在 父 进程 运行 的 任何 时 候 
RE) ， 上 所 以 这 种 信号 也 是 内 核 问 父 进程 发 的 异步 通知 。 父 进程 可 以 选 
择 忽 略 该 信号 ， 或 者 提供 一 个 该 信号 发 生 时 即 被 调用 执行 的 函数 信号 
处 理 程序 ) 。 对 于 这 种 信号 的 系统 默认 动作 是 忽略 它 。 第 10 章 将 说 明 这 
些 选 项 。 现 在 需要 知道 的 是 调用 wait 或 waitpid 的 进程 可 能 会 发 生 什 么 。 

如 果 其 所 有 子 进程 都 还 在 运行 ， 则 阻 宫 。 

“如 有 果 一 个 子 进程 已 终止 ， 正 等 待 父 进程 获取 其 终止 状态 ， 则 取得 
该 子 进 程 的 终止 状态 立即 返回 。 

“如果 它 没 有 任何 子 进 程 ， 则 立即 出 错 返 回 。 

如 果 进 程 由 于 接收 到 SIGCHLD 信 号 而 调用 wait， 我 们 期 望 wait 会 立 
即 返 回 。 但 是 如 果 在 随机 时 间 点 调用 wait， 则 进程 可 能 会 阻 寨 。 

#include <sys/wait.h> 

pid_t wait(int *statloc); 

pid_t waitpid(pid_t pid, int *statloc, int options); 

两 个 函数 返回 值 : 寿 成功， 返回 进程 ID; ite, KIO am nie 


明 ) 或 -1 

这 两 个 函数 的 区 别 如 下 。 

“在 一 个 子 进程 终止 前 ，wait 使 其 调用 者 阻塞 ， 而 waitpid 有 一 选项 ， 
可 使 调用 者 不 阻塞 。 

“waitpid 并 不 等 待 在 其 调用 之 后 的 第 一 个 终止 子 进程 ， 它 有 阁 干 个 
选项 ， 可 以 控制 它 所 等 待 的 进程 。 

如 果子 进程 已 经 终止 ， 并 且 是 一 个 僵 死 进程 ， 则 wait 立 即 返 回 并 取 
得 该 子 进程 的 状态 ;否则 wait 使 其 调用 者 阻塞 ， 直 到 一 个 子 进 程 终 止 。 
Quel Fe PASE hh Ae AS EE, WU ESE EEA IE, waiti 
立即 返回 。 因 为 wait 返 回 终 止 子 进程 的 进程 DDD， 所 以 它 总 能 了 解 是 哪 一 
个 子 进 程 终止 了 。 

这 两 个 函数 的 参数 statloc 是 一 个 整 型 指针 。 如 果 statloc 不 是 一 个 空 
指针 ， 则 终止 进程 的 终止 状态 就 存放 在 它 所 指 回 的 单元 内 。 如 果 不 关 心 
终止 状态 ， 则 可 将 该 参数 指定 为 空 指针 。 

依据 传统 ， 这 两 个 函数 返回 的 整 型 状态 字 是 由 实现 定义 的 。 其 中 某 
些 位 表示 退出 状态 (正常 返回 ) ， 其 他 位 则 指示 信号 编号 (异常 返 









































ll) ， 有 一 位 指示 是 否 产生 了 core 文 件 等 。POSIX.1 规 定 ， 终 止 状态 用 

定义 在 <sys/wait,h> 中 的 各 个 宏 来 得 看 。 有 4 个 互 斥 的 宏 可 用 来 取得 进程 

终止 的 原因 ， 它 们 的 名 字 都 以 WIF 开 始 。 基 于 这 4 个 宏 中 哪 一 个 值 为 

P 信号 编号 等 。 这 4 个 互 斥 的 宏 示 
8-4 中 。 


EE ww 
WIFEXITED (status) 若 为 正常 终止 子 进 程 返 回 的 状态 ， 则 为 真 。 对 于 这 种 情况 可 执行 
WWEXITSTATUS(tatus)， 获 取 子 进程 传送 给 exit 或 exit 参数 的 低 8 位 


WIFSIGNALED (status) | 在 为 异常 终止 子 进程 返回 的 状态 ， 则 为 真 按 到 一 个 个 捕 失 的 信号 )。 对 于 这 
种 情况 ， 可 执行 WHTERMSIG(status)， 获 取 使 子 进程 终止 的 信号 编号 另外 ， 有 
些 实现 CE Single UNIX Specification) 定义 宏 WCOREDUMP(status)， 若 已 产生 
终止 进程 的 core 文件 ， 则 它 返回 真 


WIFSTOPPED (status) 若 为 当前 暂停 子 进程 的 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 ， 可 执行 
W9TOPSIG(status)， 获 取 使 子 进 程 暂停 的 信号 编号 

WIFCONTINUED (status) | 大 在 作业 控制 暂停 后 已 经 继续 的 子 进程 返回 了 状态 ， 则 为 真 (POSIX.1 的 XSI 
扩展 ; 仅 用 于 waitpid) 


图 8-4 检查 wait 和 waitpid 所 返回 的 终止 状态 的 宏 
中 讨论 作业 控制 时 ， 将 说 明 如 何 停 止 一 个 进程 。 
SE fp 
图 8-5 中 的 函数 pr_exit 使 用 图 8-4 中 的 宏 以 打印 进程 终止 状态 的 说 
明 。 本 书 中 的 很 多 程序 都 将 调用 此 函数 。 注 意 ， 如 果 定 义 了 
WCOREDUMP 宏 ， 则 此 函数 也 人 处理 该 宏 。 

















include "apue ,hn 
finclude <sys/wait.h> 


void 
pr exit(int status) 
| 
1f (WIFEXITED (status) ) 
printf ("normal termination, exit status = %d\n", 
WEXITSTATUS (status) ); 
else if (NIFSIGNALED (status) ) 
printf ("abnormal termination, signal number = %dts\n", 
WIERMSIG (status) , 
ifdef  WCOREDUMP 
WCOREDUMP (status) ? " (core file generated)"; ""); 
telse 
"yi 
fendif 
else if (WIFSTOPPED (status) ) 
printf ("child stopped, signal number = %d\n", 
WSTOPSIG (status) ) ; 


图 8-5 打印 exit 状 态 的 说 明 
FreeBSD 8.0、Linux 3.2.0. Mac OS X 10.6.8 以 及 Solaris 10 都 支持 
WCOREDUMP 宏 。 但 是 如 果 定 义 了 _POSIX_C_SOURCE 常 量 ， 有 些 平 
台 就 隐藏 这 个 定义 〈 回 忆 2.7 节 ) 。 
图 38-6 中 程序 调用 pr_exit 函 数 ， 演 示 终 止 状态 的 各 种 值 。 


#include "apue.h" 
finclude <sys/wait.h> 


int 


main (void) 


{ 


pidt pid; 
int status; 


if ((pid = fork()) < 0) 
err sys ("fork error"); 
else if (pid == 0) 
exit (7); 


if (wait(&status) != pid) 
err_sys("wait error"); 
pr_exit (status) ; 


if ((pid = fork()) < 0) 
err_sys("fork error"); 
else if (pid == 0) 
abort (); 


if (wait (&status) != pid) 
err_sys("wait error"); 
pr_exit (status) ; 


if ((pid = fork()) < 0) 
err_sys("fork error"); 
else if (pid == 0) 
status /= 0; 


if (wait(&status) != pid) 
err_sys("wait error"); 


pr_exit (status) ; 


exit (0); 


+ 


/ 


* 


/ 


~*~ 


/ 


Æ 


/ 


~* 


/ 


* 


/ 


+ 


/ 


Æ 


/ 


i 可 *y 


wait for child */ 


and print its status */ 


/* child */ 
generates SIGABRT */ 


wait for child */ 


and print its status */ 


/* child */ 
divide by 0 generates SIGFPE */ 


wait for child */ 


and print its status */ 


图 8-6 演示 不 同 的 exit 值 





运行 该 程序 可 得 : 

$ ./a.out 

normal termination, exit status = 7 

abnormal termination, signal number = 6 (core file generated) 

abnormal termination, signal number = 8 (core file generated) 

现在 ， 我 们 可 以 从 WTERMSIG 中 打印 信号 编号 。 可 以 查看 
<Ssignal.h> 头 文件 验证 SIGABRT 的 值 为 6，SIGFPE 的 值 为 8。 我 们 将 在 
10.22 节 中 看 到 一 种 可 移植 的 方式 进行 信号 编号 到 说 明 性 名 字 的 映射 。 

正如 前 面 所 述 ， 如 果 一 个 进程 有 几 个 子 进程 ， 那 么 只 要 有 一 个 子 进 
TAIE, wait 就 返回 。 如 采 要 等 待 一 个 指定 的 进程 终止 《如 果 知 道 要 等 
待 进程 的 ID) ， 那 么 该 如 何 做 呢 ? 在 早期 的 UNIX 版 本 中 ， 必 须 调用 
wait， 然 后 将 其 返回 的 进程 ID 和 所 期 望 的 进程 ID 相 比 较 。 如 采 终 止 进程 
不 是 所 期 望 的 ， 则 将 该 进程 ID 和 终止 状态 保存 起 来 ， 然 后 再 次 调用 
wait。 反 复 这 样 做 ， 直 到 所 期 望 的 进程 终止 。 下 一 次 又 想 等 待 一 个 特定 
进程 时 ， 先 查看 已 终止 的 进程 列表 ， 寿 其 中 己 有 要 等 待 的 进程 ， 则 获取 
相关 信息 ; 否则 调用 wait。 其 实 ， 我 们 需要 的 是 等 竺 一 个 特定 进程 的 函 
数 。POSIX. 定 义 了 waitpid 函 数 以 提供 这 种 功能 “以 及 其 他 一 些 功能 

对 于 waitpid 函 数 中 pid 参 数 的 作用 解释 如 下 。 

pid ==-1 等 待 任 一 子 进程 。 此 种 情况 下 ，waitpid 与 wait 等 效 。 

pid > 0 等 待 进程 ID 与 pid 相 等 的 子 进 程 。 

pid == 0 等 待 组 ID 等 于 调用 进程 组 ID 的 任 一 子 进程 。 〈9.4 节 将 说 明 
进程 组 。) 

pid <-1 等 待 组 ID 等 于 pid 绝 对 值 的 任 一 子 进程 。 

waitpid 函 数 返回 终止 子 进程 的 进程 ID， 并 将 该 子 进程 的 终止 状态 存 
放 在 由 statloc 指 同 的 存储 单元 中 。 对 于 wait， 其 唯一 的 出 错 是 调用 进程 
没有 子 进程 (函数 调用 被 一 个 信号 中 汤 时 ， 也 可 能 返回 男 一 种 出 错 。 第 
10 章 将 对 此 进行 讨论 ) 。 但 是 对 于 waitpid， 如 果 指 定 的 进程 或 进程 组 不 
存在 ， 或 者 参数 pid 指 定 的 进程 不 是 调用 进程 的 子 进 程 ， 都 可 能 出 错 。 

options 参 数 使 我 们 能 进一步 控制 waitpid 的 操作 。 此 参数 或 者 是 0， 
或 者 是 图 8-7 中 常量 按 位 或 运算 的 结 

FreeBSD 8.0 和 Solaris 10 支 持 男 一 个 非 标 准 的 可 选 常 量 
WNOWAIT， 它 使 系统 将 终止 状态 已 由 waitpid 返 回 的 进程 保持 在 等 待 状 
态 ， 这 样 它 可 被 再 次 等 待 。 





























若 实 现 支持 作业 控制， 那么 由 pid 指定 的 任 一 也 进程 在 停止 后 已 经 继续 ， 但 其 状态 肖 


未 报告 则 返回 其 状态 (POSIX,] 的 XSI 扩展 ) 
郑 由 pid 指定 的 子 进 程 并 不 是 立即 可 用 的 ， 则 waitpid WER, HIPPIE 0 


WUNTRACED 右 某 实现 支持 作业 控制 ， 而 由 pid 指定 的 任 一 子 进程 已 处 于 停止 状态 ， 并 且 其 状态 上 
停止 以 来 还 未 报告 过 ， 则 返回 其 状态 。WIFSTOPPED 宏 确 定 返 回 值 是 否 对 应 于 一 个 停止 
的 了 进程 





图 8-7 waitpid 的 options 常 量 
waitpid 函 数 提供 了 wait 函 数 没 有 提供 的 3 个 功能 。 

(1) waitpid 可 等 竺 一 个 特定 的 进程 ， 而 wait 则 返回 任 一 终止 子 进 
程 的 状态 。 在 讨论 popen 函 数 时 会 再 说 明 这 一 功能 。 

(2) waitpid 提 供 了 一 个 wait 的 非 阻 蹇 版 本 。 有 时 和 希望 获取 一 个 子 
进程 的 状态 ， 但 不 想 阻 塞 。 

(3) waitpid 通 过 WUNTRACED 和 WCONTINUED 选 项 支持 作业 控 
制 |。 


实例 

回忆 8.5 节 中 有 关 僵 死 进程 的 讨论 。 如 果 一 个 进程 fork 一 个 子 进程 ， 
但 不 要 它 等 待 子 进程 终止 ， 也 不 希望 子 进程 处 于 伪 死 状态 直到 父 进程 终 
止 ， 实 现 这 一 要 求 的 诀窍 是 调用 fork 两 次 。 图 8-8 程 序 实现 了 这 一 点 。 











#include "apue.h" 
include <sys/wait.h> 


int 
main (void) 
| 
pidt pid; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 
} else if (pid == 0) { /* first child */ 
if ((pid = fork()) < 0) 
err sys("fork error"); 
else if (pid > 0) 
exit(0); /* parent from second fork == first child */ 


/* 

* We're the second child; our parent becomes init as soon 

* as our real parent calls exit() in the statement above. 

* Here's where we'd continue executing, knowing that when 

* we're done, init will reap our status. 

sleep (2) ; 

printf ("second child, parent pid = $ld\n", (long) getppid()); 
exit (0) ; 


if (waitpid(pid, NULL, 0) != pid) /* wait for first child */ 


err sys("waltpid error"); 


[* 

* We're the parent (the original process); we continue executing, 
* knowing that we're not the parent of the second child. 

t/ 

exit (0) ; 


图 8-8 fork 两 次 以 避免 僵 死 进程 

第 二 个 子 进程 调用 sleep 以 保证 在 打印 父 进程 ID 时 第 一 个 子 进程 已 终 
止 。 在 fork 之 后 ， 父 进程 和 子 进程 都 可 继续 执行 ， 并 且 我 们 无 法 预知 哪 
一 个 会 先 执行 。 在 fork 之 后 ， 如 果 不 使 第 二 个 子 进程 休眠 ， 那 么 它 可 能 
比 其 父 进程 先 执行 ， 于 是 它 打印 的 父 进程 ID 将 是 创建 它 的 父 进程 ， 而 不 
是 init 进 程 〈 进 程 ID 1) 。 

执行 图 8-8 程 序 得 到 : 

$ ./a.out 

$ second child, parent pid = 1 

注意 ， 当 原先 的 进程 (也 就 是 exec 本 程序 的 进程 ) 终止 时 ，shell 打 
印 其 提示 符 ， 这 在 第 二 个 子 进 程 打印 其 父 进程 ID 之 前 。 














8.7 pki 2 waitid 


Single UNIX Specification 包 括 了 另 一 个 取得 进程 终止 状态 的 函数 一 
waitid， 此 函数 类 似 于 waitpid， 但 提供 了 更 多 的 灵活 性 。 

#include <sys/wait.h> 

int waitid(idtype_t idtype, id_t id, siginfo_t *infop, int options); 

返回 值 : ERJ, WO; Aus, eE- 

tj waitpid 相似 ，waitid 允许 一 个 进程 指定 要 等 待 的 子 进程 。 但 它 
使 用 两 个 单独 的 参数 表示 要 等 待 的 子 进程 所 属 的 类 型 ， 而 不 是 将 此 与 进 
程 ID 或 进程 组 ID 组 合成 一 个 参数 。id 参 数 的 作用 与 idtype 的 值 相关 。 该 
函数 文 持 的 idtype 类 型 列 在 图 8-9 中 。 


等 待 一 特定 进程 ， 这 包含 要 等 竺 子 进 程 的 进程 了 


等 待 一 特定 进程 组 中 的 任 一 子 进程 jd 包含 要 等 待 子 进程 的 进程 组 D 
等 行 任 一 子 进程 A id 





图 8.9 waitid H idhpe 常量 
tions Z 参数 是 图 8-10 中 台 标 志 的 按 位 或 运算 。 这 些 标志 指示 调用 者 关注 哪些 状态 变化 ， 


RCONTINUED | HE, COREL, WECM, WRC 一 进程 ， 它 以 前 曾 被 停止 ， 此 后 又 已 继续 ， 但 其 状态 尚未 报告 


如 无 可 用 的 子 进程 记 册 状态， 立即 运 回 而 非 了 


WNOWATT 不 破坏 子 进程 退出 状态 。 该 子 进程 退出 状态 可 由 后 续 的 wait、waitid 或 waitpid 
调用 取得 


S-i, CARE, KAREKARE 








图 8-10 waitid 的 options 常 量 

WCONTINUED、WEXITED 或 WSTOPPED 这 3 个 常量 之 一 必须 在 
options 参 数 中 指定 。 

infop 参 数 是 指 所 siginfo? 吉 构 的 指针 。 该 结构 包含 了 造成 子 进程 状态 
改变 有 关 信 号 的 详细 信息 。10.14 节 将 进一步 讨论 siginfo 结 构 。 

本 书 讨论 的 4 种 平台 rH, Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10% 
持 waitid。 但 要 注意 的 是 ，Mac OS X 10.6.8 并 没有 设置 siginfo 结 构 中 的 
所 有 信息 。 








8.8 Phi 2 wait3 All wait4 


大 多 数 UNIX 系 统 实现 提供 了 另外 两 个 函数 wait3 和 wait4。 历 史上 ， 
这 两 个 函数 是 从 UNIX 系 统 的 BSD 分 支 延 袭 下 来 的 。 它 们 提供 的 功能 比 
POSIX.1 函 数 wait、 功能 的 要 多 一 个 ， 这 与 附加 参 
数 有 关 。 该 参数 允许 内 核 返 回 由 终止 进程 及 其 所 有 子 进程 使 用 的 资源 概 
况 。 





#include <sys/types.h> 

#include <sys/wait.h> 

#include <sys/time.h> 

#include <sys/resource.h> 

pid_t wait3(int *statloc, int options, struct rusage *rusage); 

pid_t wait4(pid_t pid, int *statloc, int options, struct rusage *rusage); 

两 个 函数 返回 值 : ARJ, EED; A tL 返回 -1 

资源 统计 信息 包括 用 户 CPU 时 间 总 量 、 系 统 CPU 时 间 总 量 、 缺 页 次 

A. PUES SINKS. AKANE getrusage(2) 手 册页 〈 这 种 





资源 信息 与 7.11 节 中 所 述 的 资源 限制 不 同 ) 。 图 8-11 列 出 了 各 个 wait 函 


, Free Linux MacOSX — Solaris 
options | rusage || POSIX] BIDEO 320 1068 1 


数 所 文 持 的 参数 。 

















图 8-11 不 同系 统 上 各 个 wait 函 数 所 文 持 的 参数 
Single UNIX Specification 的 早期 版 本 包括 wait3 函 数 。 在 SUSvV2 中 ， 
wait3 被 移 到 了 遗留 目录 下 ， 在 SUSv3 中 ， 则 删 去 了 wait3 。 





8.9 Ft 


当 多 个 进程 都 企图 对 共享 数据 进行 某 种 处 理 ， 而 最 后 的 结果 又 取决 
于 进程 运行 的 顺序 时 ， 我 们 认为 发 生 了 竞争 条 件 (race condition) 。 如 
RÆ fork 之 后 的 某 种 逻辑 显 式 或 隐 式 地 依赖 于 在 fork 之 后 是 父 进程 先 运 
行 还 是 子 进 程 先 运行 ， 那 么 fork 函数 就 会 是 竞争 条 件 活跃 的 滋生 地 。 通 
常 ， 我 们 不 能 预料 哪 一 个 进程 先 运行 。 即 使 我 们 知道 哪 一 个 进程 先 运 
ge eee eee 
度 算 法 。 

在 图 8-8 程 序 中 ， 当 第 二 个 子 进 程 打印 其 父 进 程 ID 时 ， 我 们 看 到 了 
一 个 潜在 的 竞争 条 件 。 如 果 第 二 个 子 进程 在 第 一 个 子 进程 之 前 运行 ， 则 
其 父 进 程 将 会 是 第 一 个 子 进程 。 但 是 ， 如 果 第 一 个 子 进程 先 运 行 ， 并 有 
足够 的 时 间 到 达 并 执行 exit， 则 第 二 个 子 进程 的 父 进程 就 是 init。 即 使 在 
程序 中 调用 sleep， 也 不 能 保证 什么 。 如 果 系 统 负载 很 重 ， 那 么 在 sleep 返 
回 之 后 、 第 一 个 子 进程 得 到 机 会 运行 之 前 ， 第 二 个 子 进程 可 能 恢复 运 
行 。 这 种 形式 的 问题 很 难 调 试 ， 因 为 在 大 部 分 时 间 ， 这 种 问题 并 不 出 
现 。 

如 果 一 个 进程 希望 等 待 一 个 子 进程 终止 ， 则 它 必须 调用 wait 函 数 中 
的 一 个 。 如 果 一 个 进程 要 等 待 其 父 进程 终止 (如 图 8-8 程 序 中 一 样 )〉， 
则 可 使 用 下 列 形式 的 循环 : 

while(getppid() != 1) 

sleep(1); 

这 种 形式 的 循环 称 为 轮 询 (polling) ， 它 的 问题 是 浪费 了 CPU 时 
间 ， 因 为 调用 者 每 隔 1 s 都 被 唤醒 ， 然 后 进行 条 件 测 试 。 

为 了 避免 竞争 条 件 和 轮 询 ， 在 多 个 进程 之 间 需 要 有 某 种 形式 的 信和 号 
发 送 和 接收 的 方法 。 在 UNIX 中 可 以 使 用 信号 机 制 ， 在 10.16 节 将 说 明 
它 在 解决 此 方面 问题 的 一 种 用 法 。 各 种 形式 的 进程 间 通 信 CPC) 也 可 
使 用 ， 在 第 15 章 和 第 17 章 将 对 此 进行 讨论 。 

在 父 进程 和 子 进 程 的 关系 中 ， 第 第 出 现下 述 情况 。 在 fork 之 后 ， 父 
进程 和 子 进程 都 有 一 些 事 情 要 做 。 例 如 ， 父 进程 可 能 要 用 子 进程 ID 更 
新 日 志文 件 中 的 一 个 记录 ， 而 子 进程 则 可 能 要 为 父 进程 创建 一 个 文件 。 
在 本 例 中 ， 要 求 每 个 进程 在 执行 完 它 的 一 套 初 始 化 操作 后 要 通知 对 方 ， 
并 且 在 继续 运行 之 前 ， 要 等 待 另 一 方 完 成 其 初始 化 操作 。 这 种 情况 可 以 
用 代码 摘 述 如 下 : 





























#include "apue.h" 
TELL WAIT(); /* set things up for TELL_xxx & WAIT_xxx*/ 
if ((pid = fork()) < 0) { 
err_sys("fork error"); 
} else if (pid == 0) { /* child*/ 
/* child does whatever is necessary ...*/ 
TELL_PARENT(getppid()); /* tell parent we're done*/ 
WAIT_PARENT(); /* and wait for parent*//* 
and the child continues on its way ...*/ 
exit(0); 
} 
/* parent does whatever is necessary ...*/ 
TELL_CHILD(pid); /* tell child we're done*/ 
WAIT_CHILDQ; /* and wait for child*/ 
/* and the parent continues on its way ...*/ 
exit(0); 
假定 在 头 文 件 apueh 中 定义 了 需要 使 用 的 各 个 变量 。5 个 例 程 
TELLWAIT, TELL PARENT, TELL_CHILD, WAIT_PARENTU K 
WAIT_CHILD 可 以 是 宏 ， 也 可 以 是 函数 。 
在 后 面 几 章 中 会 说 明 实现 这 些 TELL 和 WAIT 例 程 的 不 同方 法 : 
10.16 节 中 说 明 使 用 信号 的 一 种 实现 ， 图 15-7 程 序 说 明 使 用 管道 的 一 种 实 
现 。 pe oe 这 5 个 例 程 的 实例 。 
KH 
图 8-12 程 序 输 出 两 个 字符 串 : 一 个 由 子 进 程 输出 ， 另 一 个 由 父 进程 
输出 。 因 为 输出 依赖 于 内 核 使 这 两 个 进程 运行 的 顺序 及 每 个 进程 运行 的 
时 间 长 度 ， 所 以 该 程序 包含 了 一 个 竞争 条 件 。 








finclude "apue.h" 


static void charatatime(char *); 


int 


main (void) 


| 


pidt pid; 


if ((pid = fork()) < 0) { 

err_sys("fork error"); 
} else if (pid == 0) { 

charatatime ("output from child\n"); 
} else { 

charatatime ("output from parent\n"); 
] 
exit (0); 


static void 


charatatime(char *str) 


| 


char *ptr; 
int Ci 


setbuf (stdout, NULL); /* set unbuffered */ 
for (ptr = str; (c = *ptrtt) != 0; ) 
putc(c, stdout); 








图 8-12 带 有 竞争 条 件 的 程序 

在 程序 中 将 标准 输出 设置 为 不 带 缓冲 的 ， 于 是 每 个 字符 输出 都 需 调 
用 一 次 write。 本 例 的 目的 是 使 内 核能 尽 可 能 多 次 地 在 两 个 进程 之 间 进 行 
切换 ， 以 便 演示 苋 争 条 件 。 如果 不 这 样 做 ， 可 能 也 就 决 不 会 见 到 下 面 
所 示 的 输出 。 没 有 看 到 具有 错误 的 输出 并 不 意味 着 苋 争 条 件 不 存在 ， 这 
只 是 意味 着 在 此 特定 的 系统 上 未 能 见 到 它 。〉 下面 的 实际 输出 说 明 该 程 
序 的 运行 结果 是 会 改变 的 。 

$ ./a.out 

ooutput from child 

utput from parent 

$ ./a.out 

ooutput from child 

utput from parent 

$ ./a.out 

output from child 

output from parent 

修改 图 8-12 中 的 程序 ， 使 其 使 用 TELL 和 WAIT 函 数 ， 于 是 形成 了 图 
8-13 中 的 程序 。 行 首 标 以 + 号 的 行 是 新 增加 的 行 。 



































#include "apue.h" 


static void charatatime(char *); 


int 
main (void) 
{ 
pidt pid; 


TELL WAIT () ; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 
} else if (pid == 0) { 
WAIT PARENT () ; /* parent goes first*/ 
charatatime ("output from child\n"); 
} else { 
charatatime ("output from parent\n"); 
TELL_CHILD (pid); 
} 
exit (0); 


static void 
charatatime (char *str) 


| 


char “OE 
int D 
setbuf (stdout, NULL); /* set unbuffered*/ 


for (ptr = str; (c = *ptrt+) != 0; ) 
putc(c, stdout); 


n> 








图 8-13 修改 图 8-12 程 序 以 避免 竟 争 条 件 


运行 此 程序 则 能 得 到 所 预期 的 输出 一 两 个 进程 的 输出 不 再 交叉 混 


图 8-13 中 的 程序 是 使 父 进程 先 运 行 。 如 果 将 fork 之 后 的 行 改 成 : 
else if (pid == 0) { 
charatatime("output from child\n"); 
TELL_PARENT(getppid()); 
} else { 
WAIT_CHILDQ; /* child goes first */ 
charatatime("output from parent\n"); 




















} 
则 子 进程 先 运行 。 习 题 8.4 将 继续 这 一 实例 。 


8.10 打数 exec 


8.3 市 曾 提 及 用 fork 函 数 创 建新 的 子 进程 后 ， 子 进程 往往 要 调用 一 种 
exec 函 数 以 执行 男 一 个 程序 。 当 进程 调用 一 种 exec 函 数 时 ， 该 进程 执行 
的 程序 完全 蔡 换 为 新 程序 ， 而 新 程序 则 从 其 main 函 数 开始 执行 。 因 为 调 
用 exec 并 不 创建 新 进程 ， 所 以 前 后 的 进程 ID 并 未 改变 。exec 只 是 用 磁盘 
上 的 一 个 新 程序 蔡 换 了 当前 进程 的 正文 段 、 数 据 段 、 堆 7 段 和 栈 段 。 

有 7 种 不 同 的 exec 函 数 可 供 使 用 ， 它 们 常常 被 统称 为 exec 函 数 ， 我 们 
可 以 使 用 这 7 个 函数 中 的 任 一 个 。 这 些 exec 函 数 使 得 UNIX 系 统 进程 控制 
原 语 更 加 完善 。 用 fork 可 以 创建 新 进程 ， 用 exec 可 以 初始 执行 新 的 程 
序 。exit 函 数 和 wait 函 数 处 理 终 止 和 等 待 终止 。 这 些 是 我 们 需要 的 基本 
的 进程 控制 原 语 。 在 后 面 各 节 中 将 使 用 这 些 原 语 构造 妇 外 一 些 如 popen 
和 system 之 类 的 函数 。 

#include <unistd.h> 

int execl(const char *pathname, const char *arg0, ... /* (char *)0 */ ); 

int execv(const char *pathname, char *const argv[]); 

int execle(const char *pathname, const char *arg0, ... 

/* (char *)0, char *const envp[] */ ); 

int execve(const char *pathname, char *const argv[], char *const 
envp[]); 

int execlp(const char *filename, const char *arg0, ... /* (char *)0 */ ); 

int execvp(const char *filename, char *const argv[]); 

int fexecve(int fd, char *const argv[], char *const envp[]); 

7 个 函数 返回 值 ， 厦 出错， 返回 -1; 知 成 功 ， 不 返回 

这 些 函 数 之 间 的 第 一 个 区 别 是 前 4 个 函数 取 路 径 名 作为 参数 ， 后 两 
个 函数 则 取 文 件 名 作为 参数 ， 最 后 一 个 取 文 件 描述 符 作 为 参数 。 当 指定 
filename 作 为 参数 时 : 

“如 果 filename 中 包含 /， 则 就 将 其 视 为 路 径 名 ; 

“否则 就 按 PATH 环 境 变 量 ， 在 它 所 指定 的 各 目录 中 搜寻 可 执行 文 
PATH 变量 包含 了 一 张 目 录 表 《〈 称 为 路 径 前 缀 ) ， 目 录 之 间 用 冒号 
) 分 隔 。 例 如 ， 下 列 name=value 环 境 字符 串 指定 在 4 个 目录 中 进行 搜 

















C: 
Bs 
PATH=/bin:/usr/bin:/usr/local/bin:. 











最 后 的 路 径 前 级 .表示 当前 目录 。 ( 零 长 前 级 也 表示 当前 目录 。 在 
value 的 开始 处 可 用 :表示 ， 在 行 中 间 则 要 用 :: 表 示 ， 在 行 尾 以 :表示 。) 

出 于 安全 性 方面 的 考虑 ， 有 些 人 要 求 在 搜索 路 径 中 决 不 要 包括 当前 
目录 。 请 参见 Garfinkel 等 [2003]。 

如 果 execlp 或 execvp 使 用 路 径 前 级 中 的 一 个 找到 了 一 个 可 执行 文 
件 ， 但 是 该 文件 不 是 由 连接 编辑 占 产 生 的 机 器 可 执行 文件 ， 则 就 认为 该 
文件 是 一 个 shell 脚 本 ， 于 是 试 着 调用 /bin/sh， 并 以 该 人 lename 作 为 shell 的 
输入 。 

fexecve 函 数 避 倪 了 寻找 正确 的 可 执行 文件 ， 而 是 依赖 调用 进程 来 完 
成 这 项 工作 。 调 用 进程 可 以 使 用 文件 描述 符 验 证 所 需要 的 文件 并 且 无 竞 
争 地 执行 该 文件 。 否 则 ， 拥 有 特权 的 恶意 用 户 就 可 以 在 找到 文件 位 置 并 
且 验 证 之 后 ， 但 在 调用 进程 执行 该 文件 之 前 将 换 可 执行 文件 《〈 或 可 执行 
文件 的 部 分 路 径 ) ， 有 具体 可 参考 3.3 节 TOCTTOU 的 讨论 。 

第 二 个 区 别 与 参数 表 的 传递 有 关 〈] 表 示 列 表 list，v 表 示 矢 量 
vector) > KÆ execl、execlp 和 execle 要 求 将 新 程序 的 每 个 命令 行 参 数 都 
说 明 为 一 个 单独 的 参数 。 这 种 参数 表 以 空 指针 结尾 。 对 于 另外 4 个 函数 

(CexecV、execVp、execve 和 fexecve) ， 则 应 先 构造 一 个 指 同 各 参数 的 指 
针 数 组 ， 然 后 将 该 数组 地 址 作为 这 4 个 函数 的 参数 。 

在 使 用 ISO C 原 型 之 前 ， 对 execl、execle 和 execlp 三 个 函数 表示 命令 
行 参数 的 一 般 方 法 是 : 

char *arg0, char *arg1, ..., char *argn, (char *)0 

这 种 语法 显 式 地 说 明了 最 后 一 个 命令 行 参数 之 后 跟 了 一 个 空 指 针 。 
如 果 用 负 量 0 来 表示 一 个 空 指针 ， 则 必须 将 它 强制 转换 为 一 个 指针 ;人 否 
则 它 将 被 解释 为 整 型 参数 。 如 果 一 个 整 型 数 的 长 度 与 char * 的 长 度 不 
同 ， 那 么 exec 函 数 的 实际 参数 将 出 错 。 

最 后 一 个 区 别 与 回 新 程序 传递 环境 表 相 关 。 以 e 结 尾 的 3 个 函数 
(execle、execve 和 fexecve)〉 可 以 传递 一 个 指 癌 环境 字符 串 指针 数组 的 
指针 。 其 他 4 个 函数 则 使 用 调用 进程 中 的 environ 变 量 为 新 程序 复制 现 有 
的 环境 《〈 回 忆 7.9 节 及 图 7-8 中 对 环境 字符 串 的 讨论 。 其 中 曾 提 及 如 果 系 
统 支 持 setenv 和 putenv 这 样 的 函数 ， 则 可 更 改 当 前 环境 和 后 面 生成 的 子 
进程 的 环境 ， 但 不 能 影响 父 进程 的 环境 ) 。 通 常 ， 一 个 进程 允许 将 其 环 
境 传播 给 其 子 进 程 ， 但 有 时 也 有 这 种 情况 ， 进 程 想 要 为 子 进 程 指定 某 一 
个 确定 的 环境 。 例 如 ， 在 初始 化 一 个 新 登录 的 shell 时 ，login 程 序 通 稍 创 
建 一 个 只 定义 少数 几 个 变量 的 特殊 环境 ， 而 在 我 们 登录 时 ， 可 以 通过 
shell 局 动 文件 ， 将 其 他 变量 加 到 环境 中 。 

在 使 用 ISO C 原 型 之 前 ，execle 的 参数 是 : 

char *pathname, char *arg0, ..., char *argn, (char *)0, char *envp[] 



































从 中 可 见 ， 最 后 一 个 参数 是 指 癌 环 境 字符 串 的 各 字符 指针 构成 的 数 
组 的 指针 。 而 在 ISO”C 原 型 中 ， 所 有 命令 行 参 数 、 空 指针 和 envp 指 针 都 
FASS ©...) Hm. 
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助 。 字 母 p 表 示 该 函数 取 人 旨 ename 作 为 参数 ， 并 且 用 PATH 环境 变量 寻找 
可 执行 文件 。 字 母 ] 表 示 该 函数 取 一 个 参数 表 ， 它 与 字母 v 互 斥 。v 表 示 
该 函数 取 一 个 argv[ ] 矢 量 。 最 后 ， 字 母 e 表 示 该 函数 取 envp[ ] 数 组 ， 而 不 
使 用 当前 环境 。 图 8-14 显 示 了 这 7 个 函数 之 间 的 区 别 。 
































pathname | filename | fi argv{] || environ | envp(] 
Ld 














图 8-14 7 个 exec 函 数 之 间 的 区 别 

每 个 系统 对 参数 表 和 环境 表 的 总 长 度 都 有 一 个 限制 。 在 2.5.2 节 和 
图 2-8 中 ， 这 种 限制 是 由 ARG_MAX 给 出 的 。 在 POSIX.1 系 统 中 ， 此 值 
至 少 是 4 ”096 字 节 。 当 使 用 shell 的 文件 名 扩充 功能 产生 一 个 文件 名 列表 
时 ， 可 能 会 受到 此 值 的 限制 。 例 如 ， 命 令 

grep getrlimit /usr/share/man/*/* 

在 某 些 系统 上 可 能 产生 如 下 形式 的 shell 错 误 : 

Argument list too long 

由 于 历史 原因 ，System V 中 此 限制 值 是 5 120 字 市 。 早 期 BSD 系 统 的 
此 限制 值 是 20 480 字 节 。 妆 前 系统 中 ， 此 限制 值 要 大 得 多 。 (如 图 2-14 
所 示 的 程序 的 输出 ， 图 2-15 总 结 列 出 了 限制 值 。) 

为 了 摆脱 对 参数 表 长 度 的 限制 ， 我 们 可 以 使 用 xargs(1) 命 令 ， 将 长 
为 了 寻找 在 我 们 所 用 系统 手册 页 中 的 getrlimit， 
TAYE 





find /usr/share/man -type f -print | xargs grep getrlimit 

如 果 所 用 的 系统 手册 页 是 压缩 过 的 ， 则 可 使 用 

find /usr/share/man -type f -print | xargs bzgrep getrlimit 

对 于 find 命 令 ， 我 们 使 用 选项 -type f， 以 限制 输出 列表 只 包含 普通 
文件 。 这 样 做 的 原因 是 ， grep 命 令 不 能 在 目录 中 进行 模式 搜索 ， 我 们 也 
想 避 免 不 必要 的 出 错 消息 。 

前 面 曾 提 及 ， 在 执行 exec 后 ， 进 程 ID 没有 改变 。 但 新 程序 从 调用 进 
时 继承 了 的 下 列 属性 : 

。 进 程 ID 和 父 进程 ID 

“实际 用 户 ID 和 实际 组 ID 

“附属 组 ID 

“进程 组 ID 

“会话 ID 

of Hil] 2 hg 

-i EF fed ae A AD ERY) 

“当前 工作 目录 

* 根 目录 

。 文 件 模式 创建 屏蔽 字 

“文件 锁 

“进程 信号 屏蔽 

“未 处 理 信和 号 

“资源 限制 

nice 值 (遵循 XSI 的 系统 ， 见 8.16 节 ) 

etms_utime、tms_stime、tms_cutime 以 及 tms_cstime 值 

对 打开 文件 的 处 理 与 每 个 描述 符 的 执行 时 关闭 (close-on-exec) 标 
志 值 有 关 。 回 忆 图 3-7 以 及 3.14 节 中 对 FD_CLOEXEC 标 志 的 说 明 ， 进 程 
中 每 个 打开 描述 符 都 有 一 个 执行 时 关闭 标志 。 若 设置 了 此 标志 ， 则 在 执 
行 exec 时 关闭 该 描述 符 ; 否则 访 描 述 符 仍 打开 。 除 非特 地 用 fcnt 设 置 了 
该 执行 时 关闭 标记， 否则 系统 的 默认 操作 是 在 exec 后 仍 保持 这 种 描述 符 


tJ FF. 

POSIX.1 明 确 要 求 在 exec 时 关闭 打开 目录 流 〈( 见 4.22 市 中 所 述 的 
opendir 函 数 ) 。 这 通常 是 由 opendir 函数 实现 的 ， 它 调用 fcntl 函数 为 对 
应 于 打开 目录 流 的 描述 符 设 置 执行 时 关闭 标志 。 

注意 ， 在 exec 前 后 实际 用 户 ID 和 实际 组 ID 保 持 不 变 ， 而 有 效 ID 是 否 
改变 则 取决 于 所 执行 程序 文件 的 设置 用 户 ID 位 和 设置 组 ID 位 是 否 设 置 。 
如 果 新 程序 的 设置 用 户 ID 位 已 设置 ， 则 有 效用 户 ID 变 成 程序 文件 所 有 者 
的 ID; 否则 有 效用 户 ID 不 变 。 对 组 ID 的 处 理 方式 与 此 相同 。 

















在 很 多 UNIX 实 现 中 ， 这 7 个 函数 中 只 有 execve 是 内 核 的 系统 调用 。 
男 外 6 个 只 是 库 函 数 ， 它 们 最 终 部 要 调用 该 系统 调用 。 这 7 个 函数 之 间 的 
关系 示 于 图 8-15 中 。 
















execlp execle 







HE. argv 建立 argv 建立 argv 






execve 


(系统 调用 ) 









execvp PATE Wa 


environ 
build path from 
/proc/self/fd 
alias 





fexecve 








图 8-15 7 个 exec 函 数 之 间 的 关系 

在 这 种 安排 中 ， 库 函数 execlp 和 execvp 使 用 PATH 环境 变量 ， 查 
找 第 一 个 包含 名 为 filename 的 可 执行 文件 的 路 径 名 前 缀 。fexecve 库 函数 
ie /proc 把 文件 描述 符 参 数 转换 成 路 径 名 ，execve 用 该 路 径 名 去 执行 程 
Fo 

这 描述 了 在 FreeBSD 8.0 和 Linux 3.2.0 中 是 如 何 实 现 fexecve 的 。 其 他 
系统 采用 的 方法 可 能 不 同 。 例 如 ， 没 有 /proc 和 /dewfd 的 系统 可 能 把 
fexecve 实 现 为 系统 调用 ， 把 文件 描述 符 参 数 转换 成 i 节 点 指针 ， 把 execve 
实现 为 系统 调用 ， 把 路 径 名 参数 转换 成 i 节 点 指针 ， 然 后 把 execve 和 
fexecve 中 剩余 的 exec 公 共 代 码 放 到 单独 的 函数 中 ， 调 用 该 函 数 时 传 入 执 
行文 件 的 i 节点 指针 。 

实例 

图 8-16 中 的 程序 演示 T exec. 





finclude "apue ,hn 
tinclude <sys/wait.h> 


char *env init[] = { "USER=unknown", "PATH=/tmp", NULL }; 


int 
main (void) 
| 
pidt pid; 


if ((pid = fork()) < 0) { 
err sys("fork error"); 
} else if (pid == 0) {  /* specify pathname, specify environment */ 
if (execle("/home/sar/bin/echoall", "echoall", "myargl", 
"MY ARG2", (char *)0, env init) < 0) 


err sys("execle error"); 


if (waitpid(pid, NULL, 0) < 0) 


err sys("walt error"); 


if ((pid = fork()) < 0) { 
err sys("fork error"); 

} else if (pid == 0) {  /* specify filename, inherit environment */ 
if (execlp("echoall", "echoall", "only 1 arg", (char *)0) < 0) 


err sys("execlp error"); 


exit (0); 


图 8-16 exec 函 数 实例 

在 该 程序 中 先 调 用 execle， 它 要 求 一 个 路 径 名 和 一 个 特定 的 环境 。 
下 一 个 调用 的 是 execlp， 它 用 一 个 文件 名 ， 并 将 调用 者 的 环境 传送 给 新 
程序 。execlp 在 这 里 能 够 工作 是 因为 目录 /home/sar/bin 是 当前 路 径 前 绥 
之 一 。 注 意 ， 我 们 将 第 一 个 参数 (新 程序 中 的 argv[0]) 设置 为 路 径 名 的 
文件 名 分 量 。 某 些 shell 将 此 参数 设置 为 完全 的 路 径 名 。 这 只 是 一 个 惯 
例 。 我 们 可 将 argv[0] 设 置 为 任何 字符 串 。 当 login 命 令 执行 shell 时 就 是 这 
样 做 的 。 在 执行 shell 之 前 ，login 在 argv[0] 之 前 加 一 个 /作为 前 级， 这 向 
shell 指 明 它 是 作为 登录 shell 被 调用 的 。 登 录 shell 将 执行 局 动 配置 文件 

(start-up profile〉 命 令 ， 而 非 登录 shell 则 不 会 执行 这 些 命令 。 

图 8-16 中 的 程序 要 执行 两 次 的 echoall 程 序 如 图 8-17 所 示 。 这 是 一 个 

很 普通 的 程序 ， 它 回 显 所 有 命令 行 参数 及 全 部 环境 表 。 








#include "apue.h" 


int 


main(int argc, char *argv{]) 


| 


int i! 
char iso 
extern char **environ; 


for (i = 0; i < argc; itt)  /* echo all command-line args */ 
printf ("argv[%d]: %s\n", i, argv(i]); 


for (ptr = environ; *ptr != 0; ptr++) /* and all env strings */ 
printf ("ss\n", *ptr); 


exit(0); 








图 8-17 回 显 所 有 命令 行 参数 和 所 有 环境 字符 串 
执行 图 8-16 中 的 程序 得 到 : 
$ ./a.out 
argv[0]: echoall 
argv[1]: myarg1 
argv[2]: MY ARG2 
USER=unknown 
PATH=/tmp 
argv[0]: echoall 
$ argv[1]: only 1 arg 
USER=sar 
LOGNAME=sar 
SHELL=/bin/bash 





还 有 47 行 没有 列 出 
HOME=/home/sar 
VER, shell 提示 符 出 现在 第 二 个 exec 打印 argv[0] 之 前 。 这 是 因为 
父 进程 并 不 等 竺 该 子 进 程 结 束 。 


8.11 更 改 用 户 ID 和 更 改组 ID 


在 UNIX 系 统 中 ， 特 权 《〈 如 能 改变 当前 日 期 的 表示 法 ) 以 及 访问 控 
制 ( 如 能 否 读 、 写 一 个 特定 文件 ) ， 是 基于 用 户 ID 和 组 ID 的 。 当 程序 需 
要 增加 特权 ， 或 需要 访问 当前 并 不 允许 访问 的 资源 时 ， 我 们 需要 更 换 自 
己 的 用 户 ID 或 组 ID， 使 得 新 ID 具有 合适 的 特权 或 访问 权限 。 与 此 类 似 ， 
当 程 序 需 要 降低 其 特权 或 阻止 对 某 些 资源 的 访问 时 ， 也 需要 更 换 用 户 ID 
或 组 ID， 新 ID 不 具有 相应 特权 或 访问 这 些 资源 的 能 力 。 

一 般 而 言 ， 在 设计 应 用 时 ， 我 们 总 是 试图 使 用 最 小 特权 least 
privilege) 模型 。 依 照 此 模型 ， 我 们 的 程序 应 当 只 有 具有 为 完成 给 定 任务 
所 需 的 最 小 特权 。 这 降低 了 由 恶意 用 户 试 图 哄 统 我 们 的 程序 以 未 预料 的 
方式 使 用 特权 造成 的 安全 性 风险 。 

可 以 用 setuid 函 数 设置 实际 用 户 ID 和 有 效用 户 ID。 与 此 类 似 ， 可 以 
用 setgid 函 数 设置 实际 组 ID 和 有 效 组 ID。 

#include <unistd.h>int setuid(uid_t uid); 

int setgid(gid_t gid); 

两 个 函数 返回 值 : ARJ, eo; Ab, el- 
关于 谁 能 更 改 ID 有 知 干 规则 。 现 在 先 考虑 更 改 用 户 ID 的 规则 《关于 
用 户 ID 我 们 所 说 明 的 一 切 都 适用 于 组 ID) 。 

(1) 知 进程 具有 超级 用 户 特权 ， 则 setuid 函 数 将 实际 用 户 ID、 有 效 
用 户 ID 以 及 保存 的 设置 用 户 ID (saved set-user-ID) 设置 为 uid。 

(2) 知 进 程 没 有 超级 用 户 特权 ， 但 是 uid 等 于 实际 用 户 ID 或 保存 的 
设置 用 户 ID， 则 setuid 只 将 有 效用 户 了 DD 设置 为 id。 不 更 改 实际 用 户 ID 和 
保存 的 设置 用 户 ID。 

(3) 如 果 上 面 两 个 条 件 都 不 满足 ， 则 errno 设 置 为 EPERM， 并 返回 














-1. 
在 此 假定 _POSIX_SAVED_IDS 为 真 。 如 果 没 有 提供 这 种 功能 ， 则 
上 面 所 说 的 关于 保存 的 设置 用 户 ID 部 分 都 无 效 。 

在 POSIX.1 2001 版 中 ， 保 存 的 ID 是 强制 性 功能 。 而 在 较 早 版 本 中 ， 
它们 是 可 选择 的 。 为 了 弄 清 楚 某 种 实现 是 否 支 持 这 一 功能 ， 应 用 程序 在 
编译 时 可 以 测试 常量 POSIOX_SAVED_IDS， 或 者 在 运行 时 以 
_SC_SAVED _IDS 参 数 调用 sysconf 函 数 。 

关于 内 核 所 维护 的 3 个 用 户 ID， 还 要 注意 以 下 几 点 。 

(1) 只 有 超级 用 户 进程 可 以 更 改 实际 用 户 ID。 通 常 ， 实 际 用 户 ID 











是 在 用 户 登 录 时 ， 由 login(1) 程 序 设置 的 ， 而 且 决 不 会 改变 它 。 因 为 
login 是 一 个 超级 用 户 进 程 ， 当 它 调用 setuid 时 ， 设 置 所 有 3 个 用 户 ID。 

(2) 仅 当 对 程序 文件 设置 了 设置 用 户 ID 位 时 ，exec 函 数 才 设 置 有 
效用 户 ID。 如 果 设 置 用 户 ID 位 没有 设置 ，exec 了 水 数 不 会 改变 有 效用 户 
ID， 而 将 维持 其 现 有 值 。 任 何 时 候 都 可 以 调用 setuid， 将 有 效用 户 ID 设 
置 为 实际 用 户 ID 或 保存 的 设置 用 户 ID。 自 然 地 ， 不 能 将 有 效用 户 ID 设 置 
为 任 一 随机 值 。 

(3) 保存 的 设置 用 户 ID 是 由 exec 复 制 有 效用 户 ID 而 得 到 的 。 如 果 
设置 了 文件 的 设置 用 户 ID 位 ， 则 在 exec 根 据 文件 的 用 户 ID 设 置 了 进程 的 
有 效用 户 ID 以 后 ， 这 个 副本 就 被 保存 起 来 了 。 

图 8-18 总 结 了 更 改 这 3 个 用 户 ID 的 不 同方 法 。 


setuid (uid) 


设置 用 户 ID 位 关闭 


AP D As ap 设 为 id | 不 变 
有 效用 户 D 不 变 设置 为 程序 文件 的 用 户 ID | hud | 设 为 wid 
保存 的 设置 用 户 ID | 从 有 效用 户 ID 复制 | 从 有 效用 户 ID 复制 设 为 wid | 不 变 




















图 8-18 更 改 3 个 用 户 D 的 不 同方 法 
注意 ，8.2 节 中 所 述 的 getuid 和 geteuid 函 数 只 能 获得 实际 用 户 ID 和 有 
我 们 没有 可 移植 的 方法 去 获得 保存 的 设置 用 户 ID 的 
HJ 
FreeBSD 8.0 和 LINUX 3.2.0 提 供 了 getresuid 和 getresgid 函 数 ， 它 们 可 
以 分 别 用 于 获取 保存 的 设置 用 户 ID 和 保存 的 设置 组 ID。 
1. ei WXsetreuid#lsetregid 
FALE, BSDsc#ysetreuide A, ARE EAC PREP IDA BOA 
户 ID 的 值 。 
#include <unistd.h> 
int setreuid(uid_t ruid, uid_t euid); 
int setregid(gid_t rgid, gid_t egid); 
PAS eR BOR IME: ARJ, GIO; 奋 出 错 ， 返 回 -1 
如 知 其 中 任 一 参数 的 值 为 -1， 则 表示 相应 的 ID 应 当 保 持 不 变 。 
规则 很 简单 : 一 个 非特 权 用 户 总 能 交换 实际 用 户 ID 和 有 效用 户 ID。 
这 就 允许 一 个 设置 用 户 ID 程序 交换 成 用 户 的 普通 权限 ， 以 后 又 可 再 次 交 





换 回 设置 用 户 ID 权限 。POSIX.1 引 进 了 保存 的 设置 用 户 ID 特性 后 ， 其 规 
则 也 相应 加 强 ， 它 允许 一 个 非特 权 用 户 将 其 有 效用 户 ID 设置 为 保存 的 设 
置 用 户 ID。 

seteuid 和 setregid 两 个 函数 都 是 Single UNIX Specification 的 XSI 扩 
展 。 因 此 ， 可 以 期 望 所 有 UNIX 系 统 实现 都 将 对 它们 提供 支持 。 

4.3BSD 并 没有 上 面 所 说 的 保存 的 设置 用 户 ID 特性 ， 而 是 使 用 
setreuid 和 setregid 来 代理 。 这 就 允许 一 个 非特 权 用 户 交 换 这 两 个 用 户 ID 
的 值 ， 但 是 要 注意 ， 当 使 用 此 特性 的 程序 生成 shell 进 程 时 ， 它 必须 在 
exec 之 前 先 将 实际 用 户 ID 设置 为 普通 用 户 ID。 如 采 不 这 样 做 的 话 ， 实 际 
用 户 ID 就 可 能 是 具有 特权 的 《由 setreuid 的 交换 操作 造成 ) ， 然 后 shel 进 
程 可 能 会 调用 setreuid 交 换 两 个 用 户 ID 值 并 取得 更 多 权限 。 作 为 一 个 保 
护 性 的 解决 这 一 问题 的 编程 措施 ， 程 序 在 子 进程 调用 exec 之 前 ， 将 子 进 
程 的 实际 用 户 D 和 有 效用 户 ID 都 设置 成 普通 用 户 ID。 

2. 函数 seteuid 和 setegid 

POIX.1 包 含 了 两 个 函数 seteuid 和 setegid。 它 们 类 似 于 setuid 和 
setgid， 但 只 更 改 有 效用 户 ID 和 有 效 组 ID。 

#include <unistd.h> 

int seteuid(uid_t uid); 

int setegid(gid_t gid); 

两 个 函数 返回 值 ， ARJ, GIO; Aht, Re- 

一 个 非特 权 用 户 可 将 其 有 效用 户 ID 设置 为 其 实际 用 户 ID 或 其 保存 的 
设置 用 户 ID。 对 于 一 个 特权 用 户 则 可 将 有 效用 户 ID 设置 为 ud。《 这 区 
别 于 setuid 函 数 ， 它 更 改 所 有 3 个 用 户 ID。) 

图 8-19 给 出 了 本 节 所 述 的 更 改 3 个 不 同 用 户 ID 的 各 个 函数 。 
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3. 组 ID 

本 章 中 所 说 明 的 一 切 都 以 类 似 方式 适用 于 各 个 组 ID。 附 属 组 ID 不 
受 setgid、setregid 和 setegid 函 数 的 影响 。 

实例 

为 了 说 明 保 存 的 设置 用 户 ID 特性 的 用 法 ， 先 观察 一 个 使 用 该 特性 
的 程序 。 我 们 所 观察 的 是 at() 程 序 ， 它 用 于 调度 将 来 某 个 时 刻 要 运行 的 


A 
命令 。 


在 Linux 3.2.0 上 安 闭 的 at 程序 的 设置 用 户 ID 是 daemon 用 户 。 在 
FreeBSD 8.0、Mac OS X 10.6.8 以 及 Solaris 10 上 安装 的 at 程序 的 设置 用 户 
ID 是 root 用 户 。 这 人 允许 at 命令 对 守护 进程 拥有 的 特权 文件 具有 写 权 限 ， 
守护 进程 代表 用 户 运行 at 命令 。 在 Linux 3.2.0 上 ， 程 序 是 用 atd(8) 守 护 进 
程 运 行 的 。 在 FreeBSD 8. 0 和 Solaris 10 上 ， 程 序 通 过 cron(1M) 守 护 进 程 运 








pA 


行 。 在 Mac OS X 10.6.8 上 ， 程 序 通 过 launchd(8) 守 护 进程 运行 。 

为 了 防止 被 欺骗 而 运行 不 被 允许 的 命令 或 读 、 写 没有 访问 权限 的 文 
件 ，at 命 令 和 最 终 代 表 用 户 运 行 命令 的 守护 进程 必须 在 两 种 特权 之 间 切 
换 : 用 户 特 权 和 和 守护 进程 特权 。 下 面 列 出 了 其 工作 步骤 。 

(1) 程序 文件 是 由 root 用 户 拥 有 的 ， 并 且 其 设置 用 户 ID 位 已 设置 。 

当 我 们 运行 此 程序 时 ， 得 到 下 列 结果 : 
实际 用 户 ID= 我 们 的 用 户 ID RAE) 
有 效用 户 ID=root 
保存 的 设置 用 户 ID=root 

(2) at 程序 做 的 第 一 件 事 束 是 降低 特权 ， 以 用 户 特权 运行 。 它 调 
用 setuid 函数 把 有 效用 户 ID 设 置 为 实际 用 户 ID。 此 时 得 到 : 

实际 用 户 ID= 我 们 的 用 户 ID RAE) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 设置 用 户 ID=root (未 改变 ) 

(3) at 程序 以 我 们 的 用 户 特权 运行 ， 直 到 它 需 要 访问 控制 哪些 命 
令 即 将 运行 ， 这 些 命令 需要 何 时 运行 的 配置 文件 时 ，at 程序 的 特权 会 改 
变 。 这 些 文件 由 为 用 户 运 行 命令 的 守护 进程 持 有 。at 命 令 调 用 setuid 消 数 
把 有 效用 户 ID 设 为 root， 因 为 setuid 的 参数 等 于 保存 的 设置 用 户 ID， 所 以 
这 种 调用 是 许可 的 《〈 这 就 是 为 什么 需要 保存 的 设置 用 户 ID 的 原因 ) 。 现 


在 得 到 : 
实际 用 户 ID= 我 们 的 用 户 ID (RAE) 
有 效用 户 ID=root 
保存 的 设置 用 户 ID=root (未 改变 ) 
因为 有 效用 户 ID 是 root， 文 件 访问 是 允许 的 。 
(4) 修改 文件 从 而 记录 了 将 要 运行 的 命令 以 及 它们 的 运行 时 间 以 
后 ，at 命 令 通 过 调用 seteuid， 把 有 效用 户 ID 设置 为 用 户 ID， 降 低 它 的 特 
权 。 防 止 对 特权 的 误 用 。 此 时 我 们 可 以 得 到 : 
实际 用 户 ID= 我 们 的 用 户 ID RAE) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID=root (未 改变 ) 
(5) 守护 进程 开始 用 root 特权 运行 ， 代 表 用 户 运 行 命令 ， 守 护 进 
程 调用 fork， 子 进程 调用 setuid 将 它 的 用 户 ID 更 改 至 我 们 的 用 户 ID。 
为 子 进 程 以 root 特 权 和 运行， 更 改 了 所 有 的 ID， 所 以 
实际 用 户 ID= 我 们 的 用 户 ID 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID= 我 们 的 用 户 ID 
现在 守护 进程 可 以 安全 地 代表 我 们 执行 命令 ， 因 为 它 只 能 访问 我 们 




















通常 可 以 访问 的 文件 ， 我 们 没有 额外 的 权限 。 

以 这 种 方式 使 用 保存 的 设置 用 户 ID， 只 有 在 需要 提升 特权 的 时 候 ， 
我 们 通过 设置 程序 文件 的 设置 用 户 ID 而 得 到 的 额外 权限 。 然 而 ， 其 他 
时 间 进 程 在 运行 时 只 上 其 有 普通 的 权限 。 如 果 进 程 不 能 在 其 结束 部 分 切换 
回 保存 的 设置 用 户 ID， 那 么 就 不 得 不 在 全 部 运行 时 间 痢 保持 额外 的 权限 
《这 可 能 会 造成 肪 烦 ) 。 

















8.12 EEE SS Y 


所 有 现今 的 UNIX 系 统 都 支持 解释 器 文件 (interpreter file) 。 这 种 
文件 是 文本 文件 ， 其 起 始 行 的 形式 是 : 

#! pathname [ optional-argument | 

在 感叹 号 和 pathname 之 间 的 空格 是 可 选 的 。 最 常见 的 解释 器 文件 以 
下 列 行 开 始 : 

#! /bin/sh 

pathname 通 常 是 绝对 路 径 名 ， 对 它 不 进行 什么 特殊 的 处 理 ( 不 使 用 
PATH 进行 路 径 搜 索 ) 。 对 这 种 文件 的 识别 是 由 内 核 作 为 exec 系统 调用 
处 理 的 一 部 分 来 完成 的 。 内 核 使 调用 exec 函 数 的 进程 实际 执行 的 并 不 是 
该 解释 器 文件 ， 而 是 在 该 解释 器 文件 第 一 行 中 pathname 所 指定 的 文件 。 
一 定 要 将 解释 器 文件 (文本 文件 ， 它 以 检 开 头 〉， 和 解释 器 (由 该 解释 器 
文件 第 一 行 中 的 pathname 指 定 ) 区 分 开 来 。 

很 多 系统 对 解释 器 文件 第 一 行 有 长 度 限 制 。 这 包括 可 、pathname、 
可 选 参数 、 终 止 换行 符 以 及 空格 数 。 

在 FreeBSD 8.0 中 ， 该 限制 是 4 097 字 节 。Linux 3.2.0 中 ， 该 限制 为 
128 字 节 。Mac OS X 10.6.8 中 ， 访 限制 为 513 字 节 ， 而 Solaris 10 的 限制 是 
1 024 字 节 。 

实例 

让 我 们 观察 一 个 实例 ， 从 中 可 了 人 解 当 被 执行 的 文件 是 个 解释 器 文件 
时 ， 内 核 如 何 处 理 exec 

水 数 的 参数 及 该 解释 器 文件 第 一 行 的 可 选 参数 。 图 8-20 中 的 程序 调 
用 exec 执 行 一 个 解释 器 文件 。 





finclude "apue ,hy 
finclude <sys/wait.h> 


int 
main (void) 
| 
pidt pid; 


if ((pid = fork()) < 0) { 

err sys("fork error"); 
} else if (pid == 0) { /* child */ 

if (execl("/home/sar/bin/testinterp", 

"testinterp", "myargl", "MY ARG2", (char *)0) < 0) 
err sys("execl error"); 

| 
if (waitpid(pid, NULL, 0) < 0) /* parent */ 

err sys("waltpid error"); 
exit (0); 





图 8-20 执行 一 个 解释 器 文件 的 程序 
下 面 先 显示 要 被 执行 的 该 解释 占 文 件 的 内 容 (只 有 一 行 )， 接 着 是 

运行 图 8-20 中 的 程序 得 到 的 结果 。 

$ cat /home/sar/bin/testinterp 

#!/home/sar/bin/echoarg foo 

$ ./a.out 

argv[0]: /home/sar/bin/echoarg 

argv[1]: foo 

argv[2]: /home/sar/bin/testinterp 

argv[3]: myarg1 











argv[4]: MY ARG2 

程序 echoarg (解释 器 〉 回 显 每 一 个 命令 行 参 数 ( 它 就 是 图 7-4 中 的 
程序 ) 。 注 意 ， 当 内 核 exec 解 释 器 (/home/sar/bin/echoarg)〉 时 ，argv[0] 
是 该 解释 器 的 pathname，argv[1] 是 解释 器 文件 中 的 可 选 参 数 ， 其 余 参 数 
是 pathname (/home/sar/bin/testinterp〉 以 及 图 8-20 所 示 的 程序 中 调用 
execl 的 第 2 个 和 第 3 个 参数 (myargl 和 MY ARG2) 。 调 用 ”execl 时 的 
argv[1] 和 argv[2] 已 右 移 了 两 个 位 置 。 注 意 ， 内 核 取 execl 调用 中 的 
pathname 而 非 第 一 个 参数 〈testinterp ) ， 因 为 一 般 而 言 ，pathname 包 含 
了 比 第 一 个 参数 更 多 的 信息 。 

实例 

在 解释 器 pathname 后 可 跟随 可 选 参数 。 如 果 一 个 解释 器 程序 文 持 -f 
选项 ， 那 么 在 pathname 后 经 常 使 用 的 就 是 -f。 例 如 ， 可 以 以 下 列 方式 执 
行 awk(1) 程 序 : 

awk -f myfile 

它 告 诉 awk 从 文件 myfile 中 读 awk 程 序 。 

在 UNIX System V 派 生 的 很 多 系统 中 ， 常 包含 有 awk 语 言 的 两 个 版 
本 。awk 常 常 被 称 为 “ 老 awk”， 它 是 与 V7 一 起 分 发 的 原始 版 本 。 
nawk《〈 新 awk) 包含 了 很 多 增强 功能 ， 对 应 于 在 Aho、Kernighan 和 
Weinberger[1988] 中 说 明 的 语言 。 此 新 版 本 提供 了 对 命令 行 参数 的 访 
问 ， 这 是 下 面 的 例子 所 需 的 。Solaris 10 提供 了 两 个 版 本 。 

POSIX 1003.2 标 准 现在 是 Single UNIX Specification 中 基本 POSIX.1 
规范 的 一 部 分 。 在 该 标准 中 ，awk 程 序 是 其 中 的 一 个 实用 程序 。 该 实用 
程序 的 基础 也 是 Aho、Kernighan 和 Weinberger[1988] 中 所 描述 的 语言 。 

Mac OS X 10.6.8 中 的 awk 版 本 基于 贝尔 实验 室 版 本 ， 并 已 将 其 放 在 
公共 域 (public domain) P. FreeBSD 8.0 和 Linux 的 某 些 发 行 版 提供 
GNU awk (gawk) ， 它 链接 至 名 字 awk。gawk 版 本 遵循 POSIX 标 准 ， 但 
也 包括 了 一 些 扩展 。 因 为 gawk 和 贝尔 实验 室 的 awk 版 本 比较 新 ， 所 以 较 
之 nawk 或 老 版 本 的 awk 更 受 人 欢迎 。 (贝尔 实验 室 的 awk 版 本 可 从 
http://cm.bell-labs.com/cm/cs/awkbook/index.html 获 取 。) 

在 解释 器 文件 中 使 用 -f 选 项 ， 可 以 写成 : 

#!/bin/awk —f 

(在 此 解释 器 文件 中 后 跟随 awk 程 序 ) 

例如 ， 图 8-21 展 示 了 在 /usr/local/bin/awkexample 中 的 一 个 解释 器 文 

件 程序 。 











#!/usr/bin/awk -f 
# Note: on Solaris, use nawk instead 
BEGIN { 
for (i = 0s i < ARGC; itt) 
printf "ARGV[%d] = s\n", 1, ARGV[i] 


exit 


图 8-21 作为 解释 器 文件 的 awk 程序 

如 果 路 径 前 缀 之 一 是 /uswlocalbin， 则 可 以 用 下 列 方式 执行 图 8-21 
中 的 程序 (假定 我 们 已 打开 了 该 文件 的 执行 位 〉: 

$ awkexample filel FILENAME2 f3 

ARGV[0] = awk 

ARGV[1] = file1 

ARGV[2] = FILENAME2 

ARGV{[3] = f3 

执行 /bin/awk 时 ， 其 命令 行 参数 是 : 

/bin/awk -f /usr/local/bin/awkexample filel FILENAME2 f3 

解释 器 文件 的 路 径 名 C/usr/local/bin/awkexample) 被 传送 给 解释 
器 。 因 为 不 能 期 望 解释 右 《〈 在 本 例 中 是 bin/awk) 会 使 用 PATH 变量 定 
位 该 解释 器 文件 ， 所 以 只 传送 其 路 径 名 中 的 文件 名 是 不 够 的 ， 要 将 解释 
器 文件 完整 的 路 径 名 传送 给 解释 器 。 当 awk 读 解 释 器 文件 时 ， 因 为 # 是 
awk 的 注释 字符 ， 所 以 它 忽略 第 一 行 。 

可 以 用 下 列 命令 验证 上 述 命令 行 参数 。 





$ /bin/su 成 为 超级 用 户 

Password: 输入 超级 用 户口 
A 

# mv /usr/bin/awk /usr/bin/awk.save 保存 原先 的 程序 

# cp /home/sar/bin/echoarg /usr/bin/awk EN FRE 

# suspend 用 作业 控制 挂 起 
超级 用 户 shell 

[1] + Stopped /bin/su 


$ awkexample filel FILENAME2 f3 
argv[0]: /bin/awk 


argv[1]: -f 

argv[2]: /usr/local/bin/awkexample 
argv[3]: file1 

argv[4]: FILENAME2 


argv[5]: f3 

$ fg 用 作业 控制 恢复 
超级 用 户 shell 

/bin/su 

# mv /usr/bin/awk.save /usr/bin/awk 恢复 原先 的 程序 

# exit 终止 超级 用 户 
Shell 


在 此 例子 中 ， 解 释 器 的 -{ 选 项 是 必需 的 。 正 如 前 述 ， 它 告诉 awk 在 
什么 地 方 找 到 awk 程 序 。 如 果 在 解释 器 文件 中 删除 -f 选 项 ， 则 在 试图 运 
行 该 解释 器 文件 时 ， 通 向 输 出 一 条 出 错 消 轧 。 该 出 错 消息 的 精确 文本 可 
能 有 所 不 同 ， 这 取决 于 解释 器 文件 存放 在 何 处 以 及 其 余 参 数 是 否 表 示 现 
有 的 文件 等 。 因 为 在 这 种 情况 下 命令 行 参数 是 : 

/bin/awk /usr/local/bin/awkexample filel FILENAME2 f3 

于 是 awk 企图 将 字符 串 /swvlocalMbin/awkexample 解 释 为 一 个 awk 程 
序 。 如 果 不 能 同 解 释 占 传递 至 少 一 个 可 选 参数 (在 本 例 中 是 -f) ， 那 么 
这 些 解 释 器 文件 只 有 对 shell 才 是 有 用 的 。 

是 否 一 定 需 要 解释 器 文件 呢 ? 那 也 不 完全 如 此 。 但 是 它们 确实 使 用 
户 得 到 效率 方面 的 好 处 ， 其 代价 是 内 核 的 额外 开销 《因为 识别 解释 器 文 
件 的 是 内 核 ) 。 由 于 下 述 理由 ， 解 释 器 文件 是 有 用 的 。 

(1) 有 些 程序 是 用 茶 种 语言 写 的 脚本 ， 解 释 吉 文件 可 将 这 一 事实 
隐藏 起 来 。 例 如 ， 为 了 执行 图 8-21 程 序 ， 只 需 使 用 下 列 命令 行 : 

awkexample optional-arguments 

而 并 不 需要 知道 该 程序 实际 上 是 一 个 awk 脚 本 ， 盏 则 就 要 以 下 列 方 
式 执行 该 程序 : 

awk -f awkexample optional-arguments 

(2) 解释 器 脚本 在 效率 方面 也 提供 了 好 处 。 再 考虑 一 下 前 面 的 例 
ear, Nawk 脚 本 的 事实 ， 但 是 将 其 放 在 一 个 shell 肝 

awk ’BEGIN { 

for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV[i] 
exit 


P $* 








这 种 解决 方法 的 问题 是 要 求 做 更 多 的 工作 。 首 先 ，shell 读 此 命令 ， 
然后 试图 execlp 此 文件 名 。 因 为 shell 脚 本 是 一 个 可 执行 文件 ， 但 却 不 是 
机 器 可 执行 的 ， 于 是 返回 一 个 错误 ，execlp 束 认为 该 文件 是 一 个 shell H 
A CES bp Emtec PPC) 。 然 后 执行 /bin/sh， 并 以 该 shell 脚本 的 路 
径 名 作为 其 参数 。shell 正 确 地 执行 我 们 的 shell 脚 本 ， 但 是 为 了 运行 awk 
程序 ， 它 调用 fork、exec 和 wait。 于 是 ， 用 一 个 shell 脚 本 代 蔡 解释 器 脚本 

要 更 多 的 开销 。 

(3) 解释 器 脚本 使 我 们 可 以 使 用 除 /bin/sh 以 外 的 其 他 shell 来 编号 = 
shell 脚 本 。 当 execlp 找 到 一 个 非 机 器 可 执行 的 可 执行 文件 时 ， 它 总 是 调 
用 /bin/sh 来 解释 执行 该 文件 。 但 是 ， 用 解释 器 脚本 则 可 简单 地 守成 : 

#!/bin/csh 

(在 解释 器 文件 中 后 跟随 C shell fill AS >) 

再 一 次 ， 我 们 也 可 将 此 放 在 一 个 /bin/sh 脚 本 中 (然后 由 其 调用 C 
shell) ， 但 是 要 有 更 多 的 开销 。 如 果 3 个 shell 和 awk 没有 用 # 作 为 注释 
符 ， 则 上 面 所 说 的 都 无 效 。 





8.13 届 效 sSvstem 


在 程序 中 执行 一 个 命令 字符 串 很 方便 。 例 如 ， 假 定 要 将 时 间 和 日 期 
放 到 某 一 个 文件 中 ， 则 可 使 用 6.10 节 中 的 函数 实现 这 一 点 。 调 用 time 得 
到 当前 日 历时 间 ， 接 着 调用 localtime 将 日 历时 间 变 换 为 年 、 月 、 日 、 

时 、 分 、 秒 、 周 日 的 分 解 形式 ， 然 后 调用 strftime 对 上 面 的 结果 进行 格式 
化 处 理 ， 最 后 将 结果 写 到 文件 中 。 但 是 用 下 面 的 system 函 数 则 更 容易 做 
到 这 一 点 : 

system("date > file"); 

ISO C 定 义 了 system 函 数 ， 但 是 其 操作 对 系统 的 依赖 性 很 强 。 
POSIX.1 包 括 了 system 接 口 ， 它 扩展 了 ISO C 定 义 ， 摘 述 了 system 在 
POSIX.1 环 境 中 的 运行 行为 。 

#include <stdlib.h> 

int system(const char *cmdstring); 














返回 值 : ILF) 
如 果 cmdstring 是 一 个 空 指针 ， 则 仅 当 命令 处 理 程 序 可 用 时 ，system 
返回 非 0 值 ， 这 一 特征 可 以 确定 在 一 个 给 定 的 操作 系统 上 是 售 文 持 
system 函数 。 在 UNIX 中 ，system 总 是 可 用 的 。 
因为 System 在 其 实现 中 调用 了 fork、exec 和 waitpid， 因 此 有 3 种 返回 


(1) fork 失 败 或 者 waitpid 返 回 除 EINTR 之 外 的 出 错 ， 则 system 返 回 
-1， 并 且 设 置 errno 以 指示 错误 类 型 。 

(2) WR exec 失 败 ( 表 示 不 能 执行 shel) ， 则 其 返回 值 如 同 shell 
执行 了 exit(127) 一 样 。 

(3) 否则 所 有 3 个 函数 〈fork、exec 和 waitpid) 都 成 功 ， 那 么 
system 的 返回 值 是 shel 的 终止 状态 ， 其 格式 已 在 waitpid 中 说 明 。 

如 果 waitpid 被 一 个 捕捉 到 的 信号 中 断 ， 则 某 些 早期 的 system 实现 
都 返回 错误 类 型 值 EINTR。 但 是 ， 因 为 没有 可 用 的 策略 能 让 应 用 程序 从 
这 种 错误 类 型 中 恢复 〈 子 进程 的 进程 ID 对 调用 者 来 说 是 未 知 的 ) 。 
POSIX 后 来 增加 了 下 列 要 求 : 在 这 种 情况 下 system 不 返回 一 个 错误 。 
《10.5 节 中 将 讨论 被 中 断 的 系统 调用 。 ) 

图 8-22 中 的 程序 是 system 函 数 的 一 种 实现 。 它 对 信号 没有 进行 处 
理 。10.18 节 中 将 修改 此 函数 使 其 进行 信号 处 理 。 





tinclude <sys/wait.h> 
#include <errno.h> 
include <unistd.h> 


int 
system(const char *cmdstring) /* version without signal handling */ 
| 

pidt pid; 

int status; 


if (cmdstring == NULL) 
return (1); /* always a command processor with UNIX */ 


if ((pid = fork()) < 0) { 
status = -1; /* probably out of processes */ 


} else if (pid == 0) { /* child */ 
execl ("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
exit (127); /* execl error */ 

} else | /* parent */ 


while (waitpid(pid, &status, 0) < 0) { 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


return(status) ; 











图 8-22 system 函 数 〈 没 有 对 信和 号 进行 处 理 ) 

shell 的 -c 选 项 告诉 shell 程 序 取 下 一 个 命令 行 参数 《在 这 里 是 
cmdstring) 作为 命令 输入 《而 不 是 从 标准 输入 或 从 一 个 给 定 的 文件 中 读 
ME) 。shell 对 以 null 字 节 终 止 的 命令 字符 串 进 行 语法 分 析 ， 将 它们 分 
成 命令 行 参数 。 传 递 给 shell 的 实际 命令 字符 串 可 以 包含 任 一 有 效 的 shell 
命令 。 例 如 ， 可 以 用 < 和 > 对 输入 和 输出 重 定 问 。 

如 果 不 使 用 shell 执 行 此 命令 ， 而 是 试图 由 我 们 自己 去 执行 它 ， 那 将 
相当 困难 。 首 先 ， 我 们 必须 用 execlp 而 不 是 execl， 像 shell 那 样 使 用 
PATH 变量 。 我 们 必须 将 nul 字 节 终 止 的 命令 字符 串 分 成 各 个 命令 行 参 
数 ， 以 便 调 用 execlp。 最 后 ， 我 们 也 不 能 使 用 任何 一 个 shell 元 字符 。 

注意 ， 我 们 调用 _exit 而 不 是 exit。 这 是 为 了 防止 任 一 标准 IO 缓冲 

这些 缓冲 会 在 fork 中 由 父 进程 复制 到 子 进程 ) 在 子 进 程 中 被 冲洗 。 

用 图 8-23 中 的 程序 对 这 种 实现 的 System 函数 进行 测试 〈pr_exit 函 数 
定义 在 图 8-5 程 序 中 ) 。 














finclude "apue.h" 
finclude <sys/wait.h> 


int 
main (void) 
| 


int status; 


if ((status = system("date")) < 0) 
err sys("system() error"); 


pr exit (status) ; 


if ((status = system("nosuchcommand")) < 0) 
err sys("system() error"); 


pr exit (status) ; 


if ((status = system("who; exit 44")) < 0) 
err sys("system() error"); 


pr_exit (status) ; 


exit(0); 





图 8-23 调用 system 函 数 
运行 图 8-23 程 序 得 到 ; 
$ ./a.out 


Sat Feb 25 19:36:59 EST 2012 

normal termination, exit status = 0 对 于 date 

sh: nosuchcommand: command not found 

normal termination, exit status = 127 对 于 无 此 种 命令 


Sar console Jan 1 14:59 

Sar ttys000 Feb 7 19:08 

Sar ttys001 Jan 15 15:28 

sar ttys002 Jan 15 21:50 

sar ttys003 Jan 21 16:02 

normal termination, exit status = 44 对 于 exit 


使 用 system 而 不 是 直接 使 用 fork 和 exec 的 优点 是 : system 进 行 了 所 需 
a 出 错 处 理 以 及 各 种 信号 处 理 〈 在 10.18 节 中 的 下 一 个 版 本 system 函 
wP) 。 

在 UNIX 的 早期 系统 中 ， 包 括 SVR3.2 和 4.3BSD， 都 没有 waitpid 函 
数 ， 于 是 父 进程 用 下 列 形式 的 语句 等 待 子 进程 : 

while ((lastpid = wait(&status)) != pid && lastpid != -1) 


如 果 调 用 system 的 进程 在 调用 它 之 前 已 经 生成 子 进 程 ， 那 么 将 引 
起 问题 。 因 为 上 面 的 while 语 句 一 直 循环 执行 ， 直 到 由 system 产 生 的 子 进 
时 终止 才 停 止 ， 如 果 不 是 用 pid 标 识 的 任 一 子 进程 在 pid 子 进程 之 前 终 
止 ， 则 它们 的 进程 ID 和 终止 状态 都 被 while 语 句 丢 弃 。 实 际 上 ， 由 于 wait 
不 能 等 待 一 个 指定 的 进程 以 及 其 他 一 些 原因 ，POSIX.1 Rationale 才 定 义 
了 waitpid 函 数 。 如 果 不 提供 waitpid 函 数 ，popen 和 pclose 函 数 也 会 发 生 同 
样 的 问题 〈 见 15.3 节 ) 。 

设置 用 户 ID 程序 

如 果 在 一 个 设置 用 户 ID 程序 中 调用 system， 那 会 发 生 什 么 呢 ? 这 
是 一 个 安全 性 方面 的 漏洞 ， 决 不 应 当 这 样 做 。 图 8-24 程 序 是 一 个 简单 程 
序 ， 它 只 是 对 其 命令 行 参 数 调用 system 函 数 。 





finclude "apue ,hn 


int 
main(int argc, char *argv[]) 
| 


int status; 


if (arge < 2) 
err quit("command-line argument required"); 


if ((status = system(argv[1])) < 0) 
err sys("system() error"); 


pr exit (status) ; 


exit (0); 


图 8-24 用 system 执 行 命令 行 参 数 
将 此 程序 编译 成 可 执行 目标 文件 tsys。 S | 
图 8-25 所 示 的 是 另 一 个 简单 程序 ， 它 打印 实际 用 户 ID 和 有 效用 户 
ID 。 





finclude "apue 


int 

main (void) 

| 
printf ("real uid = %d, effective uid = sd\n", getuid(), geteuid()); 
exit (0); 











图 8-25 打印 实际 用 户 ID 和 有 效用 户 ID 
将 此 程序 编译 成 可 执行 目标 文件 printuids。 运 行 这 两 个 程序 ， 得 到 
如 下 结果 : 
$ tsys printuids 正常 执行 ， 无 特权 real uid 
= 205, effective uid = 205 
normal termination, exit status = 0 











$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 
# chown root tsys 更 改 所 有 者 

# chmod u+s tsys 增加 设置 用 户 ID 

# Is -l tsys 检验 文件 权限 和 所 有 者 
-rwsrwxr-x 1 root 7888 Feb 25 22:13 tsys 

# exit 退出 超级 用 户 shell 


$ tsys printuids 

real uid = 205, effective uid = 0 哎呀 ! 这 是 一 个 安全 性 漏洞 

normal termination, exit status = 0 

我 们 给 予 tsys 程 序 的 超级 用 户 权 限 在 system 中 执行 了 fork 和 exec 之 后 
仍 被 保持 下 来 。 

有 些 实现 通过 更 改 /bin/sh， 当 有 效用 户 ID 与 实际 用 户 ID 不 匹配 时 ， 
将 有 效用 户 ID 设置 为 实际 用 户 ID， 这 样 可 以 关闭 上 述 安 全 漏洞 。 在 这 些 
系统 中 ， 上 述 示例 的 结果 就 不 会 发 生 。 不 管 调 用 system 的 程序 设置 用 户 
ID 位 状态 如 何 ， 都 会 打印 出 相同 的 有 效用 户 ID。 

如 果 一 个 进程 正 以 特殊 的 权限 《设置 用 户 ID 或 设置 组 ID) 运行 ， 它 
又 想 生 成 男 一 个 进程 执行 男 一 个 程序 ， 则 它 应 当 直 接 使 用 fork 和 exec， 
而 且 在 fork 之 后 、exec 之 前 要 更 改 回 普通 权限 。 设 置 用 户 ID 或 设置 组 ID 











程序 决 不 应 调用 System 函数 。 

这 种 警告 的 一 个 理由 是 : system 调 用 shell 对 命令 字符 串 进行 语法 分 
析 ， 而 shell 使 用 IFS 变 量 作为 其 输入 字段 分 隅 符 。 早 期 的 shell 版 本 在 被 
调用 时 不 将 此 变量 重 置 为 普通 字符 集 。 这 就 允许 一 个 恶意 的 用 户 在 调用 
system 之 前 设置 IFS， 造 成 system 执 行 一 个 不 同 的 程序 。 


8.14 进程 会 计 


大 多 数 UNIX 系 统 提供 了 一 个 选项 以 进行 进程 会 计 〈Pprocess 
accounting) 人 处理。 局 用 该 选项 后 ， 每 当 进 程 结束 时 内 核 束 写 一 个 会 计 
记录 。 典 型 的 会 计 记 录 包 含 总 量 较 小 的 二 进 制 数 据 ， 一 般 包括 命令 名 、 
所 使 用 的 CPU 时 间 总 量 、 用 户 ID 和 组 ID、 启 动 时 间 等 。 本 节 将 较 详细 地 
说 明 这 种 会 计 记 录 ， 这 样 也 使 我 们 得 到 了 一 个 再 次 观察 进 程 的 机 会 ， 以 
及 使 用 5.9 节 中 所 介绍 的 fread 函 数 的 机 会 。 

任 一 标准 都 没有 对 进程 会 计 进行 过 说 明 。 于 是 ， 所 有 实现 都 有 令 人 
厌烦 的 差别 。 例 如 ， 关 于 IO 的 数量 ，Solaris 10 使 用 的 单位 是 字 节 ， 
FreeBSD 8.0 和 Mac OS X 10.6.8 使 用 的 单位 是 块 ， 但 又 不 考虑 不 同 的 块 
长 ， 这 使 得 该 计数 值 并 无 实际 效用 。Linux 3.2.0 则 完全 没有 保持 MO 统计 


ML 

每 种 实现 也 都 有 上 自己 的 一 套 管 理 命令 去 处 理 这 种 原始 的 会 计数 据 。 
例如 ，Solaris 提供 了 runacct(1m) 和 acctcom(1)，FreeBSD 则 提供 sa(8) 命 令 
处 理 并 总 结 原始 会 计数 据 。 

一 个 至 今 没 有 说 明 的 函数 (acct) 启用 和 禁用 进程 会 计 。 唯 一 使 用 
这 一 函数 的 是 accton(8) 命 令 ( 这 是 在 几 种 平台 上 都 类 似 的 少数 几 条 命令 
中 的 一 条 ) 。 超 级 用 户 执 行 一 个 带路 径 名 参数 的 accton 命 令 启用 会 计 处 
理 。 会 计 记 录 写 到 指定 的 文件 中 ， 在 FreeBSD 和 Mac OS X 中 ， 该 文件 通 
7 ze /var/account/acct; 在 Linux 中 ， 该 文件 是 /var/account/pacct; 在 
Solaris 中 ， 该 文件 是 /var/adm/pacct。 执 行 不 带 任何 参数 的 accton 命 令 则 
停止 会 计 处 理 。 

会 计 记 录 结 构 定 义 在 头 文件 <sys/accth> 中 ， 虽 然 每 种 系统 的 实现 各 
不 相同 ， 但 会 计 记 录 样 式 基本 如 下 : 











typedef u_short comp_t; /* 3-bit base 8 exponent; 13-bit 
fraction*/ 
struct acct 
{ 
char ac flag; /* flag (see Figure 8.26)*/ 
char ac_ stat; /* termination status(signal & core 
flag only)*/ 


/* (Solaris only)*/ 
uid t ac uid; /* real user ID*/ 


gid t ac gid; 
dev_t ac tty; 
time_t ac_btime; 
comp_t ac_utime; 
comp_t ac_stime; 
comp_t ac_etime; 
comp_t ac_mem; 
comp_t ac_io; 


write)*/ 


comp_t ac_rw; 


char ac_comm|[8]; 


Solaris,*/ 


/* real group ID*/ 

/* controlling terminal*/ 
/* starting calendar time*/ 

/* user CPU time*/ 

/* system CPU time*/ 

/* elapsed time*/ 

/* average memory usage*/ 
/* bytes transferred (by read and 


/* blocks read or written*/ 
/* command name: [8] for 


/* "blocks" on BSD systems*/ 
/* (not present on BSD systems)*/ 
/* [10] for Mac OS X, [16] for FreeBSD, and*/ 


/* [17] for Linux*/ 


}; 
在 大 多 数 的 平台 上 ， 时 间 是 以 时 钟 滴答 数 记 录 的 ， 但 FreeBSD 以 微 


秒 进行 记录 的 。 








见 图 8-26。 
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图 8-26 


程 是 由 fork 产生 的 ， 但 从 未 调用 exec 


ac_flag 成 员 记 录 了 进程 执行 期 间 的 东 些 事件 。 这 些 事件 





会 计 记 录 中 的 ac_flag 值 


会 计 记 录 所 需 的 各 个 数据 《〈 各 CPU 时 间 、 传 输 的 字符 数 等 ) 都 由 内 
核 保存 在 进程 表 中 ， 并 在 一 个 新 进程 被 创建 时 初始 化 (如 fork 之 后 在 子 
o 进程 终止 时 号 一 个 会 计 记 录 。 这 产生 两 个 后 果 。 


进程 中 ) 


第 一 ， 我 们 不 能 获取 永远 不 终止 的 进程 的 会 计 记录 。 像 init 这 样 的 
进程 在 系统 生命 周期 中 一 直 在 运行 ， 并 不 产生 会 计 记录 。 这 也 同样 适合 
于 内 核 守 护 进 程 ， 它 们 通常 不 会 终止 。 

第 二 ， 在 会 计 文件 中 记录 的 顺序 对 应 于 进程 终止 的 顺序 ， 而 不 是 它 
们 启动 的 顺序 。 为 了 确定 启动 顺序 ， 需 要 读 全 部 会 计 文件 ， 并 按 启 动 日 
历时 间 进 行 排 序 。 这 不 是 一 种 很 完善 的 方法 ， 因 为 日 历时 间 的 单位 是 秒 
CIL 1.10 节 ) ， 在 一 个 给 定 的 秒 中 可 能 启动 了 多 个 进程 。 而 墙 上 时 钟 
时 间 的 单位 是 时 钟 滴答 GHA, BEARS ACE6O~128) 。 但 是 我 们 并 
不 知道 进程 的 终止 时 间 ， 所 知道 的 只 是 启动 时 间 和 终止 顺序 。 这 就 意味 
着 ， 即 使 墙 上 时 钟 时 间 比 启动 时 间 要 精确 得 多 ， 仍 不 能 按照 会 计 文件 中 
的 数据 重 构 各 进程 的 精确 启动 顺序 。 

会 计 记录 对 应 于 进程 而 不 是 程序 。 在 fork 之 后 ， 内 核 为 子 进程 初始 
化 一 个 记录 ， 而 不 是 在 一 个 新 程序 被 执行 时 初始 化 。 虽 然 exec 并 不 创建 
一 个 新 的 会 计 记 录 ， 但 相应 记录 中 的 命令 名 改变 了 ，AFORK 标 志 则 被 
清除 。 这 意味 着 ， 如 果 一 个 进程 顺序 执行 了 3 个 程序 CA exec By B exec 
C， 最 后 是 C exit) ， 只 会 写 一 个 会 计 记 录 。 在 该 记录 中 的 命令 名 对 应 于 
但 CPU 时 间 是 程序 A、B 和 C 之 和 。 

实例 

为 了 得 到 某 些 会 计数 据 以 便 查 看 ， 我 们 按 图 8-27 编 写 了 测试 程序 。 

测试 程序 的 源 代 码 如 图 8-28 所 示 。 该 程序 调用 4 次 fork。 每 个 子 进程 
做 不 同 的 事情 ， 然 后 终止 。 









































/bin/dd 





图 8-27 会 计 处 理 实例 的 进程 结构 


#include "apue .hn 


int 


main (void) 


{ 


pidt pid; 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != 0) { /* parent */ 
sleep (2) ; 
exit (2); /* terminate with exit status 2 */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != 0) { /* first child */ 
Sleep (4); 
abort (); /* terminate with core dump */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid != 0) { /* second child */ 
execl ("/bin/dd", "dd", "if=/etc/passwd", "of=/dev/null", NULL); 
exit (7); /* shouldn't get here */ 


if ((pid = fork()) < 0) 
err_sys("fork error"); 


else if (pid != 0) { /* third child */ 
sleep (8) ; 
exit (0); /* normal exit */ 


sleep (6) ; /* fourth child */ 
kill(getpid(), SIGKILL); /* terminate w/signal, no core dump */ 
exit (6); /* shouldn't get here */ 





图 8-28 产生 会 计数 据 的 各 
在 Solaris 上 运行 该 ; Na ay 时 序 
; 交 测 试 程序 ， 然 
he eae 





#include "apue.h" 
#include <sys/acct.h> 


#if defined(BSD) /* different structure in FreeBSD */ 
#define acct acctv2 

#define ac flag ac_trailer.ac_ flag 

#define FMT "%-*.*s e = %.0f, chars = %.0f, %c %c bc %c\n" 
#elif defined(HAS AC STAT) 


| 


#define FMT "$-*.*s e = %6ld, chars = %7ld, stat = %3u: %c %c %c $c\n" 


#else 

#define FMT "%3-*.*s e = %6ld, chars = %7ld, %c %c bc %c\n" 
#endif 

#if defined (LINUX) 

#define acct acct v3 /* different structure in Linux */ 
#endif 


#if !defined(HAS ACORE) 
#define ACORE 0 

#endif 

#if !defined(HAS_AXSIG) 
#define AXSIG 0 

#tendif 


#if !defined (BSD) 
static unsigned long 
compt2ulong(comp_t comptime) /* convert comp_t to unsigned long */ 
{ 
unsigned long val; 
int exp; 


val = comptime & Oxlfff; /* 13-bit fraction */ 


exp = (comptime >> 13) & 7; /* 3-bit exponent (0-7) */ 
while (exp-- > 0) 
val *= 8; 


return (val); 


} 
#endif 


int 
main(int argc, char *argv[]) 
{ 
struct acct acdata; 
FILE *fp; 


if (arge != 2) 
err quit("usage: pracct filename"); 


if ((fp = fopen(argv[1], "r")) == NULL) 
err _sys("can't open %s", argv[1]); 
while (fread(&acdata, sizeof(acdata), 1, fp) == 1) { 


printf(FMT, (int)sizeof(acdata.ac_comm), 
(int) sizeof (acdata.ac_comm), acdata.ac_comm, 
#if defined (BSD) 
acdata.ac_etime, acdata.ac io, 


telse 
compt2ulong(acdata.ac etime), compt2ulong(acdata.ac 10), 
fendi f 
tif defined(HAS AC STAT) 
(unsigned char) acdata.ac stat, 
tendif 
acdata.ac flag & ACORE ? 'D':'', 
acdata.ac flag & AXSIG ? 'X' : ' ', 
acdata.ac flag & AFORK ? 'F' : '', 
acdata,ac flag & ASU 2? 'S' 3 ' '); 





| 
if (ferror (fp)) 

err sys("read error"); 
exit (0); 





图 8-29 打印 从 系统 会 计 文 件 中 选 出 的 字段 
BSD 派生 的 平台 不 支持 ac_stat 成 员 ， 所 以 我 们 在 支持 该 成 员 的 平 
台 上 定义 了 HAS_AC_STAT 常量 。 基 于 特性 而 非 平台 定义 的 符号 常量 使 
代码 更 易 读 ， 也 使 我 们 更 容易 修改 程序 。 修 改 的 方法 是 对 编译 命令 增加 
新 的 定义 。 蔡 代 方 法 可 以 是 使 用 : 
#if !defined(BSD) && !defined(MACOS) 
但 是 ， 当 将 应 用 移植 到 其 他 平台 上 时 ， 这 种 方法 会 带 来 很 大 的 不 











便 。 

我 们 定义 了 类 似 的 常量 以 判断 该 平台 是 否 支 持 ACORE 和 AXSIG 会 
计 标 志 。 我 们 不 能 直接 使 用 这 两 个 标志 符 写 ， 其 原因 是 ， 在 Linux 中 ， 
它们 被 定义 为 enqum 类 型 值 ， 而 在 ##ifdef 表 达 式 中 不 能 使 用 此 种 类 型 值 。 

为 了 进行 测试 ， 执 行 下 列 操作 步骤 。 

(1) 成 为 超级 用 户 ， 用 accton 命 令 启 用 会 计 处 理 。 注 意 ， 当 此 命令 
结束 时 ， 会 计 处 理 已 经 启用 ， 因 此 在 会 计 文 件 中 的 第 一 个 记录 应 来 自 这 
一 命令 。 


(2) 终止 超级 用 户 shell， 运 行 图 8-28 程 序 。 这 会 追加 6 个 记录 到 会 


计 文 件 中 《超级 用 户 shell 一 个 、 父 进程 一 个 、4 个 子 进 程 各 一 个 ) 。 

在 第 二 个 子 进程 中 ，execl 并 不 创建 一 个 新 进程 ， 所 以 对 第 二 个 进程 
只 有 一 个 会 计 记 录 。 (3) 成 为 超级 用 尸 ， 停 止 会 计 处 理 。 因 为 在 accton 
命令 终止 时 已 经 停止 会 计 处 理 ， 所 以 不 会 在 会 计 文 件 中 增加 一 个 记录 。 

(4) 运行 图 8-29 程 序 ， 从 会 计 文 件 中 选 出 字段 并 打印 。 

第 4 步 的 输出 如 下 面 所 示 。 在 每 一 行 中 都 对 进程 退 加 了 说 明 ， 以 便 








后 面 讨 论 。 

accton e= 1, chars = 336, stat= 0: S 

sh e= 1550,chars = 20168,stat = 0: S 

dd e = 2, chars = 1585, stat = 0: Fy 
Ft ere 

a.out e= 202, chars = 0, stat = 0: 父 进 
程 

a.out e= 420, chars = 0, stat = 134: F 第 一 
个 子 进 程 

a.out e= 600, chars = 0, stat = 9: F 第 四 
ANF ETE 

a.out e= 801, chars = 0, stat = 0: F 第 三 
AS FEA 


墙 上 时 钟 时 间 值 的 单位 是 每 秒 滴答 数 。 从 图 2-15 中 可 见 ， 本 系统 的 
每 秒 滴答 数 是 100。 例 如 ， 在 父 进程 中 的 。” sleep(2) 对 应 于 墙 上 时 钟 时 间 
202 个 时 钟 滴答 。 对 于 第 一 个 子 进 程 ，sleep(4) 变 成 420 时 钟 滴答 。 注 
意 ， 一 个 进程 休眠 的 时 间 总 量 并 不 精确 。 F102 5K [Fl Fllsleep eh 
数 。) 调用 fork 和 exit 也 需要 一 些 时 间 。 

注意 ，ac_stat 成 员 并 不 是 进程 的 真正 终止 状态 。 它 只 是 8.6 节 中 讨论 
的 终止 状态 的 一 部 分 。 如 果 进 程 异常 终止 ， 则 此 字 节 包含 的 信息 只 是 
core 标 志 位 〈 一 般 是 最 高 位 ) 以 及 信号 编号 数 〈 一 般 是 低 7 位 ) 。 如 果 
进程 正常 终止 ， 则 从 会 计 文 件 不 能 得 到 进程 的 退出 (exit) 状态 。 对 于 
第 一 个 子 进程 ， 此 值 是 128+6。128 是 core 标 志 位 ，6 是 此 系统 信和 号 
SIGABRT 的 值 ( 它 是 由 调用 abort 产 生 的 ) 。 第 四 个 子 进程 的 值 是 9， 它 
对 应 于 SIGKILL 的 值 。 从 会 计 文件 的 数据 中 不 能 分 辨 出 ， 父 进程 在 退出 
时 所 用 的 参数 值 是 2， 第 三 个 子 进程 退出 时 所 用 的 参数 值 是 0。 

dd 进程 将 文件 /etc/passwd 复 制 到 第 二 个 子 进程 中 ， 该 文件 的 长 度 是 
777 字 节 。 而 IO 字符 数 是 此 值 的 2 倍 ， 其 原因 是 读 了 777 字 节 ， 然 后 又 写 
了 777 字 节 。 即 使 输出 到 空 设 备 ， 但 仍 对 IO 字符 数 进行 计算 。dd 命令 
还 有 31 个 附加 字 节 ， 用 于 报告 读 写 字 节 数 的 摘要 信息 ， 该 摘要 信息 也 
会 在 stdout 上 打印 输出 。 














ac_flag 值 与 我 们 所 预料 的 相同 。 除 调用 execl 的 第 二 个 子 进程 以 外 ， 
其 他 子 进程 都 设置 了 F 标志 。 父 进程 没有 设置 F 标志 ， 其 原因 是 执行 父 
进程 的 交互 式 shell 调 用 fork， 然 后 执行 a.out 文 件 。 和 第 一 个 子 进程 调用 
abort，abort 产 生 信号 SIGABRT， 产 生 了 core 转 储 。 该 进程 的 X 标 志和 D 
标志 都 没有 打开 ， 因 为 Solaris 不 文 持 它们 ;相关 信息 可 从 ac_stat 字 段 导 
出 。 第 四 个 子 进程 也 因 信 号 而 终止 ， 但 是 SIGKILL 信 号 并 不 产生 core 转 
EF 它 只 是 终止 该 进程 。 

最 后 要 说 明 的 是 : 第 一 个 子 进程 的 WO 字符 数 为 0， 但 是 该 进程 产 
Et core “文件 。 其 原因 是 写 core 文 件 所 需 的 IO 并 不 由 该 进程 负 





8.15 用 户 标 识 


任 一 进程 都 可 以 得 到 其 实际 用 户 ID 和 有 效用 户 ID 及 组 ID。 但 是 ， 我 
们 有 时 和 希望 找到 运行 该 程序 用 户 的 登录 名 。 我 们 可 以 调用 
getpwuid(getuid0)， 但 是 如 果 一 个 用 户 有 多 个 登录 名 ， 这 些 登 录 名 又 对 
应 着 同一 个 用 户 ID， 又 将 如 何 呢 ? w a de 
录 项 ， 它 们 的 用 户 ID 相同 ， 但 登录 shell 不 同 。) 系统 通常 记录 用 户 登 
录 时 使 用 的 名 字 〈 见 6.8 节 ) ， 用 getlogin 函 数 可 以 获取 此 登录 名 。 

#include <unistd.h> 

char *getlogin(void); 

返回 值 : ABA, WIS Ae AB NTRET tH, J&IEINULL 

如 采 调 用 此 函数 的 进程 没有 连接 到 用 户 登 录 时 所 用 的 终端 ， 则 函数 
会 失败 。 通 常 称 这 些 进 程 为 守护 进程 (daemon) ， 第 ”13 章 将 对 这 种 进 
程 专门 进行 讨论 。 

给 出 了 登录 名 ， 就 可 用 getpwnam 在 口令 文件 中 查找 用 户 的 相应 记 
录 ， 从 而 确定 其 登录 shell 等 。 

为 了 找到 登录 名 ，UNIX 系 统 在 历史 上 一 直 是 调用 ttyname 函 数 《〈 见 
18.9 节 ) ， 然 后 在 utmp 文 件 〈 见 6.8 节 ) 中 找 匹 配 项 。FreeBSD 和 Mac OS 
X 将 登录 名 存放 在 与 进程 表 项 相关 联 的 会 话 结构 中 ， 并 提供 系统 调用 获 
取 该 登录 名 。 

System V 提 供 cuserid 函 数 返 回 登 录 名 。 此 函数 先 调 用 getlogin 函 数 ， 
如 果 失 败 则 再 调用 getpwuid(getuid0)。IEEE 标 准 1003.1-1988 说 明了 
cuserid， 但 是 它 以 有 效用 户 ID 而 不 是 实际 用 户 ID 来 调用 。POSIX.1 的 
1990 版 本 删除 了 cuserid 函 数 。 

环境 变量 LOGNAME 通 常 由 login(1) 以 用 户 的 登录 名 对 其 赋 初 值 ， 
并 由 登录 shell 继 承 。 但 是 ， 用 户 可 以 修改 环境 变量 ， 所 以 不 能 使 用 
LOGNAME 来 验证 用 户 ， 而 应 当 使 用 getlogin 函 数 。 














8.16 FE Vil 


UNIX 系统 历史 上 对 进程 提供 的 只 是 基于 调度 优先 级 的 粗 粒 度 的 控 
制 。 调 度 策 略 和 调度 优先 级 是 由 内 核 确定 的 。 进 程 可 以 通过 调整 nice 值 
选择 以 更 低 优先 级 运行 (通过 调整 nice 值 降低 它 对 CPU 的 占有 ， 因 此 该 

进程 是 “友好 的 ”>) 。 只 有 特权 进程 允许 提高 调度 权限 。 

POSIX 实 时 扩展 增加 了 在 多 个 调度 类 别 中 选择 的 接口 以 进一步 细 调 
行为 。 我 们 这 里 只 讨论 用 于 调整 nice 值 的 接口 ， 这 些 包括 在 POSIX.1 的 
XSI 扩 展 选 项 中 。 关 于 实时 调度 扩展 更 多 的 信息 ， 可 参考 
Gallmeister[1995]. 

Single UNIX Specification 中 nice 值 的 范围 在 0~(2*NZERO)-1 之 
间 ， 有 些 实现 支持 0 一 2*NZERO。mnice 值 越 小 ， 优 先 级 越 高 。 虽 然 这 看 
起 来 有 点 倒退 ， 但 实际 上 是 有 道理 的 : 你 越 友好 ， 你 的 调度 优先 级 就 越 
低 。NZERO 是 系统 默认 的 nice 值 。 

注意 ， 定 义 ”NZERO 的 头 文件 因 系 统 而 异 。 除 了 头 文 件 以 外 ， 
Linux 3.2.0 “可 以 通过 非 标准 的 sysconf 参 数 (_SC_NZERO) 来 访问 
NZERO 的 值 。 

进程 可 以 通过 nice 函 数 获取 或 更 改 它 的 nice 值 。 使 用 这 个 函数 ， 进 
程 只 能 影响 自己 的 nice 值 ， 不 能 影响 任何 其 他 进程 的 nice 值 。 

#include <unistd.h> 

int nice(int incr); 

返回 值 : 若 成 功 ， 返 回 新 的 nice 值 NZERO; 若 出 错 ， 返 回 -1 

incr 参 数 被 增加 到 调用 进程 的 nice 值 上 。 如 果 incr 太 大 ， 系 统 直 接 把 
它 降 到 最 大 合法 值 ， 不 给 出 提示 。 类 似 地 ， 如 条 incr 太 小 ， 系 统 世 会 无 
声 县 地 把 它 提高 到 最 小 合法 值 。 由 于 -1 是 合法 的 成 功 返回 值 ， 在 调用 
pide 函数 之 前 需要 清楚 erro， 年 nice 函 数 返 回 -1 时 ， 需 要 检查 它 的 值 。 

如 果 nice 调 用 成 功 ， 并 且 返 回 值 为 -1， 那 么 errmo 仍 然 为 0。 如 果 errno 不 
为 0， 说 明 nice 调 用 失败 。 

getpriority 疯 数 可 以 像 nice 函 数 那 样 用 于 获取 进程 的 nice 值 ， 但 是 
getpriority 还 可 以 获取 一 组 相关 进程 的 nice 值 。 

#include <sys/resource.h> 

int getpriority(int which, id_t who); 

BEE: 若 成 功 ， 返 回 -NZERO~NZERO-1 之 间 的 nice 值 ; 若 出 错 ， 返 
回 -1 














which 参 数 可 以 取 以 下 三 个 值 之 一 : PRIO_PROCESS ”表示 进程 ， 
PRIO_PGRP 表示 进程 组 ， PRIO_USER 表 示 用 户 ID。which 参 数控 制 
who 参 数 是 如 何 解释 的 ，who 参 数 选 择 感 兴趣 的 一 个 或 多 个 进程 。 如 果 
who 参 数 为 0， 表 示 调 用 进程 、 进 程 组 或 者 用 户 〈 取 决 于 which 参 数 的 
值 ) 。 当 which 设 为 PRIO_USER 并 且 who 为 0 时 ， 使 用 调用 进程 的 实际 用 
户 ID。 如 果 which 参 数 作 用 于 多 个 进程 ， 则 返回 所 有 作用 进程 中 优先 级 
最 高 的 〈 最 小 的 nice 值 ) 。 

setpriority 函 数 可 用 于 为 进程 、 进 程 组 和 属于 特定 用 户 ID 的 所 有 进程 
设置 优先 级 。 

#include <sys/resource.h> 

int setpriority(int which, id_t who, int value); 

返回 值 : 知 成 功 ， 返 回 0; Aiwa, e- 

参数 which 和 who 与 getpriority 函 数 中 相同 。value 增 加 到 NZERO 上， 
然后 变 为 新 的 nice 值 。 

nice 系统 调用 起 源 于 早期 Research UNIX 系统 的 PDP-11 版 本 。 
getpriority 和 setpriority 函 数 源 于 4.2BSD。 

Single UNIX Specification 没 有 对 在 fork 之 后 子 进 程 是 否 继承 nice 值 制 
定 规则 ， 而 是 留 给 具体 实现 上 自行 决定 。 但 是 遵循 XSI 的 系统 要 求 进程 调 
用 exec 后 保留 nice 值 。 

在 FreeBSD 8.0、Linux 3.2.0. MacOS X 10.6.8 以 及 Solaris 10 中 ， 子 
进程 从 父 进 程 中 继承 nice 值 。 

实例 

图 8-30 的 程序 度量 了 调整 进程 nice 值 的 效果 。 两 个 进程 并 行 运 行 ， 
各 和 目 增 加 自己 的 计数 器 。 父 进程 使 用 了 默认 的 nice 值 ， 子 进程 以 可 选 命 
邻 参数 指定 的 调整 后 的 nice 值 运行 。 运 行 10”s 后 ， 两 个 进程 都 打印 各 自 
的 计数 值 并 终止 。 通 过 比较 不 同 nice 值 的 进程 的 计数 值 的 差异 ， 我 们 可 
以 了 解 nice 值 时 如 何 影 响 进程 调度 的 。 





#include "apue.h" 
#include <errno.h> 
#include <sys/time.h> 


#if defined (MACOS) 
#include <sys/syslimits.h> 
#elif defined (SOLARIS) 
#include <limits.h> 

#elif defined (BSD) 
#include <sys/param.h> 
#endif 


unsigned long long count; 
struct timeval end; 


void 
checktime (char *str) 
{ 


struct timeval tyi 


gettimeofday(&tv, NULL); 

if (tv.tv_sec >= end.tv_sec && tv.tv_usec >= end.tv_usec) { 
printf ("s count = Slld\n", str, count); 
exit (0); 


int 
main(int argc, char *argv[]) 


{ 


pidt pid; 
char we 
int nzero, ret; 


int adj = 0; 


setbuf (stdout, NULL); 
#if defined (NZERO) 


nzero = NZERO; 
felif defined (_SC_NZERO) 
nzero = sysconf (_SC_NZERO) ; 
telse 
#error NZERO undefined 
fendif 
printf ("NZERO = %d\n", nzero); 
if (argc == 2) 
adj = strtol(argv[1], NULL, 10); 
gettimeofday(&end, NULL); 
end.tv_sec += 10; /* run for 10 seconds */ 


if ((pid = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pid == 0) {  /* child */ 
s = "child"; 
printf ("current nice value in child is $d, adjusting by %d\n", 
nice(0)+nzero, adj); 
errno = 0; 
if ((ret = nice(adj)) == -1 && errno != 0) 
err sys("child set scheduling priority"); 
printf ("now child nice value is d\n", rettnzero) ; 
} else { /* parent */ 
s = "parent"; 
printf ("current nice value in parent is d\n", nice(0)+nzero) ; 
} 
for(;;) { 
if (++count == 0) 
err quit("%s counter wrap", s); 
checktime (s); 














图 8-30 更 改 nice 值 的 效果 
执行 该 程序 两 次 : 一 次 用 默认 的 nice 值 ， 另 一 次 用 最 高 有 效 nice 值 
最 低调 度 优先 级 ) 。 程 序 运 行 在 单 处 理 器 Linux 系 统 上 ， 以 显示 调度 

程序 如 何在 不 同 nice 值 的 进程 间 进 行 CPU 的 共享 。 否则 ， 对 于 有 空闲 资 
源 的 系统 ， 如 多 处 理 器 系统 《或 多 核 CPU) ， 两 个 进程 可 能 无 需 共识 
CPU《〈 和 运行 在 不 同 的 处 理 器 上 ) ， 就 无 法 看 出 具有 不 同 nice 值 的 两 个 进 
程 的 差异 。 

$ ./a.out 

NZERO = 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 0 

now child nice value is 20 

child count = 1859362 

parent count = 1845338 

$ ./a.out 20 

NZERO = 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 20 

now child nice value is 39 

parent count = 3595709 

child count = 52111 

当 两 个 进程 的 nice 值 相同 时 ， 父 进程 占用 50.2% 的 CPU， 子 进程 占用 
49.8% 的 CPU。 可 以 看 到 ， 两 个 进程 被 有 效 地 进行 了 平等 对 待 。 百 分 比 
并 不 完全 相同 ， 是 因为 进程 调度 并 不 精确 ， 而 且 子 进程 和 父 进程 在 计算 
结束 时 间 和 处 理 循环 开始 时 间 之 间 执 行 了 不 同 数量 的 处 理 。 

相 比 之 下 ， 当 子 进 程 有 最 高 可 能 nice 值 〈 最 低 优先 级 ) 时， 我 们 看 
到 父 进 程 占用 98.5% 的 CPU， 而 子 进 程 只 占用 1.5% 的 CPU。 这 些 值 取决 
ae 度 程序 如 何 使 用 nice 值 ， 因 此 不 同 的 UNIX 系 统 会 产生 不 同 的 
CPU 占用 比 。 























8.17 进程 时 站 


在 1.10 节 中 说 明了 我 们 可 以 度量 的 3 个 时 间 : 墙 上 时 钟 时 间 、 用 户 
CPU 时 间 和 系统 CPU 时 间 。 任 一 进程 都 可 调用 times 函 数 获 得 它 自己 以 及 
己 终 止 子 进程 的 上 述 值 。 

#include <sys/times.h> 

clock_t times(struct tms *buf)); 
返回 值 : 知 成 功 ， 返 回流 逝 的 墙 上 时 钟 时 间 《〈 以 时 钟 滴答 数 为 单位 ) ; 

若 出 错 ， 返 回 -1 

此 函数 填写 由 buf 指 向 的 tms 结 构 ， 该 结构 定义 如 下 : 

struct tms { 

clock t tms_utime; /* user CPU time */ 

clock_t tms_stime; /* system CPU time */ 

clock_t tms_cutime; /* user CPU time,terminated children */ 
clock_t tms_cstime; /* system CPU time,terminated children */ 





}; 

注意 ， 此 结构 没有 包含 增 上 时 钟 时 间 。times 函 数 返 回 增 上 时 钟 时 间 
作为 其 函数 值 。 此 值 是 相对 于 过 去 的 某 一 时 刻度 量 的 ， 所 以 不 能 用 其 绝 
对 值 而 必须 使 用 其 相对 值 。 例 如 ， 调 用 times， 保 存 其 返回 值 。 在 以 后 某 
个 时 间 再 次 调用 times， 从 新 返回 的 值 中 减 去 以 前 返回 的 值 ， 此 差 值 就 是 
墙 上 时 钟 时 间 。《 一 个 长 期 运行 的 进程 可 能 其 增 上 时 钟 时 间 会 溢出 ， 当 
然 这 种 可 能 性 极 小 ， 见 习题 1.5) 。 

该 结构 中 两 个 针对 子 进程 的 字段 包含 了 此 进程 用 本 章 开 始 部 分 的 
wait 函 数 族 已 等 竺 到 的 各 子 进程 的 值 。 

所 有 由 此 函数 返回 的 clock_t 值 都 用 _SC_CLK_TCK〔 由 sysconf 函数 
返回 的 每 秒 时 钟 滴答 数 ， 见 2.5.4 节 ) 转换 成 秒 数 。 

大 多 数 实现 提供 了 getrusage(2) 函 数 ， 该 函数 返回 CPU 时 间 以 及 指示 
资源 使 用 情况 的 男 外 14 个 值 。 它 起 源 于 BSD 系 统 ， 所 以 BSD 派 生 的 实现 
aE eee 

SE fl 

图 8-31 中 的 程序 将 每 个 命令 行 参数 作为 shell 命 令 串 执行 ， 对 每 个 命 
令 计时 ， 并 打印 从 tms 结 构 取 得 的 值 。 











#include "apue ,hn 
finclude <sys/times.h> 


static void pr_times(clock t, struct tms *, struct tms *); 
static void do cmd(char *); 


int 


main(int argc, char *argv[]) 


{ 


int i? 


setbuf (stdout, NULL); 
for (i = Lp <i afge; i44) 

do_cmd(argv[i]); /* once for each command-line arg */ 
exit (0); 


static void 
do_cmd(char *cmd) /* execute and time the "cmd" */ 


{ 


struct tms tmsstart, tmsend; 
chock t start, end; 
int status; 


printf ("\ncommand: %s\n", cmd); 


if ((start = times(&tmsstart)) == -1) /* starting values */ 
err _sys("times error"); 


if ((status = system(cmd)) < 0) /* execute command */ 
err_sys("system() error"); 


if ((end = times(&tmsend)) == -1) /* ending values */ 
err_sys ("times error"); 


pr_times (end-start, &tmsstart, &tmsend); 
pr_exit (status); 


static void 
pr_times(clock_t real, struct tms *tmsstart, struct tms *tmsend) 


{ 


static long clktck = 0; 


if (clktck == 0) /* fetch clock ticks per second first time */ 
if ((clktck = sysconf(_SC_CLK_TCK)) € 0) 
err_sys("sysconf error"); 


printf(" real: %7.2f\n", real / (double) clktck); 
printf (" weer: $7.2£\n"; 

(tmsend->tms_utime - tmsstart->tms_utime) / (double) clktck); 
printf (" sys: S7.2E\n", 

(tmsend->tms_stime - tmsstart->tms_stime) / (double) clktck); 
printf (" child users FIZAN", 

(tmsend->tms_cutime - tmsstart->tms_cutime) / (double) clktck); 
printf(" child sys: EZEN"; 

(tmsend->tms_cstime - tmsstart->tms_cstime) / (double) clktck); 





图 8-31 计时 并 执行 所 有 命令 行 参 数 
运行 此 程序 可 以 得 到 : 
$ ./a.out "sleep 5" "date 
command: sleep 5 

real: 5.01 
user: 0.00 
sys: 0.00 
child user: 0.00 
child sys: 0.00 
normal termination, exit status = 0 
command: date 
Sun Feb 26 18:39:23 EST 2012 
real: 0.00 
user: 0.00 
sys: 0.00 
child user: 0.00 
child sys: 0.00 
normal termination, exit status = 0 
command: man bash >/dev/null 
real: 1.46 
user: 0.00 
sys: 0.00 
child user: 1.32 
child sys: 0.07 
normal termination, exit status = 0 
在 前 两 个 命令 中 ， 命 令 执行 时 间 足 够 快 避免 了 以 可 报告 的 精度 记录 

CPU 时 间 。 但 在 第 3 个 命令 中 ， 运 行 了 一 个 处 理 时 间 足 够 长 的 命令 来 表 

R mene 而 shell 和 命令 正 是 在 子 进程 中 执 

行 的 。 








"H 


man bash >/dev/null" 








8.18 小 结 


对 在 UNIX 环 境 中 的 高 级 编程 而 言 ， 完 整地 了 解 UNIX 的 进程 控制 是 
非常 重要 的 。 其 中 必须 熟练 掌握 的 只 有 几 个 函数 一 fork、exec 系 列 、 
_exit、wait 和 waitpid。 很 多 应 用 程序 都 使 用 这 些 简单 的 函数 。fork 函 数 
也 给 了 我 们 一 个 了 解 竞 争 条 件 的 机 会 。 

本 章 说 明 了 system 函 数 和 进程 会 计 ， 这 也 使 我 们 能 进一步 了 解 所 有 
这 些 进 程控 制 函数 。 本 章 还 说 明了 exec 函 数 的 另 一 种 变 体 : 解释 器 文件 
及 它们 的 工作 方式 。 对 各 种 不 同 的 用 户 ID 和 组 ID (实际 、 有 效 和 保存 
的 ) 的 理解 ， 对 编写 安全 的 设置 用 户 ID 程序 是 至 关 重 要 的 。 

在 了 解 进程 和 子 进程 的 基础 上 ， 下 一 章 将 进一步 说 明 进程 和 其 他 进 
会 话 和 作业 控制 。 第 10 半 将 说 明 信 号 机 制 并 以 此 结束 对 进 
时 的 讨论 。 














习题 


8.1 在 图 8-3 程 序 中 ， 如 果 用 exit 调 用 代 蔡 _exit 调 用 ， 那 么 可 能 会 使 
标准 输出 关闭 ， 使 printf 返 回 -1。 修 改 该 程序 以 验证 在 你 所 使 用 的 系统 
oo 如 果 并 非 如 此 ， 你 怎样 处 理 才 能 得 到 类 似 结果 
Ne? 

8.2 回忆 图 7-6 中 典型 的 存储 空间 布局 。 由 于 对 应 于 每 个 函数 调用 的 
栈 帧 通常 存储 在 栈 中 ， 并 且 由 于 调用 vfork 后 ， 子 进程 运行 在 父 进程 的 地 
址 衬 间 中 ， 如 果 不 是 在 main 函 数 中 而 是 在 另 一 个 函数 中 调用 vfork， 此 后 
子 进程 又 从 该 函数 返回 ， 将 会 发 生 什 么 ”请 编写 一 段 测试 程序 对 此 进行 
验证 ， 并 且 画 图 说 明 发 生 了 什么 。 

8.3 ” 重 写 图 8-6 中 的 程序 ， 把 wait 换 成 waitid。 不 调用 pr_exit， 而 从 
siginfo 结 构 中 确定 等 价 的 信息 。 

8.4 当 用 $./a.out 执行 图 8-13 中 的 程序 一 次 时 ， 其 输出 是 正确 的 。 但 
是 耕 将 该 程序 按 下 列 方式 执行 多 次 ， 则 其 输出 不 正确 。 

$ ./a.out ; a.out ;./a.out 

output from parent 

ooutput from parent 

ouotuptut from child 

put from parent 

output from child 

utput from child 

原因 是 什么 ? 怎样 才能 更 正 此 类 错误 ? 如 采 使 子 进程 首先 输出 ， 还 
会 发 生 此 问题 吗 ? 

8.5 在 图 8-20 所 示 的 程序 中 ， 调 用 exed， 指 定 pathname 为 解释 器 文 
件 。 如 果 将 其 改 为 调用 execlp， 指 定 testinterp 的 名 ename， 并 且 如 果 目 
ae/home/sar/bin Ae Be A 则 运行 该 程序 时 ，argv[2] 的 打印 输出 是 什 
A? 

8.6 ”编写 一 段 程序 创建 一 个 僵 死 进程 ， 然 后 调用 system 执 行 ps(1) 命 
令 以 验证 该 进程 是 僵 死 进程 。8.7 8.10 节 中 提 及 POSIX.1 要 求 在 exec 时 关 
闭 打开 目录 流 。 按 下 列 方法 对 此 进行 验证 : 对 根 目录 调用 opendir， 介 看 
在 你 系统 上 实现 的 DIR 结 构 ， 然 后 打印 执行 时 关闭 标志 。 接 着 打开 同一 
目录 读 并 打印 执行 时 关闭 标志 。 
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在 上 一 音 我 们 已 了 解 到 进程 之 间 具 有 关系 。 首 先 ， 每 个 进程 有 一 个 
父 进程 《初始 的 内 核 级 进程 通 音 是 目 己 的 父 进程 ) 。 当 子 进程 终止 时 ， 
父 进 程 得 到 通知 并 能 取得 子 进 程 的 退出 状态 。 在 8.6 节 说 明 waitpid 函 数 
我 们 也 提 到 了 进程 组 ， 以 及 如 何等 待 进程 组 中 的 任意 一 个 进程 终 


”本 音 将 更 详细 地 说 明 进 程 组 以 及 POSIX.1 引 入 的 会 话 的 概念 。 还 将 
介绍 登录 shell (登录 时 所 调用 的 ) 和 所 有 从 登录 shell 启 动 的 进程 之 间 的 
关系 。 

在 说 明 这 些 关系 时 不 可 能 不 谈 及 信号 ， 而 讨论 信号 时 又 需要 很 多 本 
章 介 绍 的 概念 。 如 果 你 不 熟悉 UNIX 系 统 信号 机 制 ， 则 可 能 先 要 浏览 一 
下 第 10 章 。 

















9.2 2X vin SK 


先 说 明 当 我 们 登录 到 UNIX 系 统 时 所 执行 的 各 个 程序 。 在 早期 的 
UNIX 系 统 〈 如 V7) 中 ， 用 户 用 哑 终 端 ( 用 硬 连 接连 到 主机 〉 进 行 登 
录 。 终 端 或 者 是 本 地 的 〈 直 接连 接 ) 或 者 是 远程 的 (通过 调制 解 调 器 连 
fe) 。 在 这 两 种 情况 下 ， 登 录 都 经 由 内 核 中 的 终端 设备 驱动 程序 。 例 
如 ， 在 PDP-11 上 常用 的 设备 是 DH-11 和 DZ-11。 因 为 连 到 主机 上 的 终端 
设备 数 是 固定 的 ， 所 以 同时 的 登录 数 也 就 有 了 已 知 的 上 限 。 

随 着 位 映射 图 形 终端 的 出 现 ， 开 发 出 了 窗口 系统 ， 它 同 用 户 提 供 了 
与 主机 系统 进行 交互 的 新 方式 。 创 建 终端 窗口 的 应 用 也 被 开发 出 来 ， 它 
仿真 了 基于 字符 的 终端 ， 使 得 用 户 可 以 用 熟悉 的 方式 〈 即 通过 shell 命 令 
行 ) 与 主机 进行 交互 。 

现今 ， 某 些 平台 允许 用 户 在 登录 后 启动 一 个 窗口 系统 ， 而 男 一 些 平 
台 则 上 自动 为 用 户 启动 窗口 系统 。 在 后 面 一 种 情况 中 ， 用 户 可 能 仍然 需要 
登录 ， 这 取决 于 窗口 系统 是 如 何 配 置 的 ( 某 些 窗口 系统 可 被 配置 成 自动 
为 用 户 登 录 ) 。 

我 们 现在 描述 的 过 程 用 于 经 由 终端 登录 至 UNIX 系 统 。 该 过 程 几乎 
与 所 使 用 的 终端 类 型 无 关 ， 所 使 用 的 终端 可 以 是 基于 字符 的 终端 、 仿 真 
基于 字符 终端 的 图 形 终端 ， 或 者 运行 窗口 系统 的 图 形 终端 。 

1. BSD 终 端 登录 

在 过 去 35 年 中 ，BSD 终端 登录 过 程 并 没有 多 少 改变 。 系 统管 理 者 
创建 通常 名 为 /etc/ttys 的 文件 ， 其 中 ， 每 个 终端 设备 都 有 一 行 ， 每 一 行 说 
明 设 备 名 和 传 到 getty 程序 的 参数 。 例 如 ， 其 中 一 个 参数 说 明了 终端 的 
波 特 率 等 。 当 系统 上 自 举 时 ， 内 核 创建 进程 ID Al 的 进程 ， 也 就 是 init 进 
程 。init 进 程 使 系统 进入 多 用 户 模 式 。init 恋 取 文 件 /etcttys， 对 每 一 个 允 
许 登 录 的 终端 设备 ，init 调 用 一 次 fork， 它 所 生成 的 子 进程 则 exec getty 程 
序 。 这 种 情况 示 于 网 9-1 中 。 

图 9-1 中 所 有 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 是 0〈 也 就 是 说 ， 它 
们 都 具有 超级 用 户 特权 ) 。init 以 空 环境 exec getty 程 序 。 

getty 对 终端 设备 调用 open 函数 ， 以 读 、 写 方式 将 终端 打开 。 如 果 
设备 是 调制 解 调 器 ， 则 open 可 能 会 在 设备 驱动 程序 中 灌 留 ， 直 到 用 户 拨 
号 调制 解 调 器 ， 并 且 线 路 被 接 通 。 一 旦 设备 被 打开 ， 则 文件 描述 符 0、 
1、2 就 被 设置 到 该 设备 。 然 后 getty 输 出 ogin: ”之 类 的 信息 ， 并 等 待 用 
户 键入 用 户 名 。 如 果 终 端 文 持 多 种 速度 ， 则 getty 可 以 测试 特殊 字符 以 




















便 适 当地 更 改 终端 速度 〈 波 特 率 ) 。 关 于 getty 程 序 以 及 有 关 数 据 文 件 
(gettytab) 的 细节 ， 请 参 沿 UNIX 系 统 手 册 。 
当 用 户 键 入 了 用 户 名 后 ，getty 的 工作 就 完成 了 。 然 后 它 以 类 似 于 下 
列 的 方式 调用 login 程 序 : 
execle("/bin/login", "login", "-p", username, (char *)0, envp); 

(在 gettytab 文 件 中 可 能 会 有 一 些 选 项 使 其 调用 其 他 程序 ， 但 系统 
默认 是 login 程 序 ) 。init 以 一 个 空 环境 调用 getty。getty 以 终端 名 (如 
TERM=foo， 其 中 终端 foo 的 类 型 取 自 gettytab 文 件 ) 和 在 gettytab 中 说 明 
的 环境 字符 串 为 login 创 建 一 个 环境 〈envp 参 数 ) 。-p 标 志 通 知 login 保 留 
传递 给 它 的 环境 ， 也 可 将 其 他 环境 字符 串 加 到 该 环境 中 ， 但 是 不 要 蔡 换 





它 。 图 9-2 显 示 了 login 刚 被 调用 后 这 些 进程 的 状态 。 


进程 ID 1 


每 个 终端 执行 
-次 fork 


每 个 子 进程 
exec getty 





图 9-1 为 允许 终端 登录 ，init 调 用 的 进程 





进程 ID 1 


读 取 /etc/ttys 
pei inie | 人 端 执行 一 次 fork 
创建 空 环境 


‘fork A 


打开 终端 设备 
(文件 描述 符 0, 1, 2); 
读 用 户 名 

初始 环境 集 





图 9-2 login 调 用 后 进程 的 状态 

因为 最 初 的 init 进 程 具有 超级 用 户 特权 ， 上 所 以 图 9-2 中 的 所 有 进程 都 
有 超级 用 户 特 权 。 图 9-2 中 底部 3 个 进程 的 进程 ID 相同 ， 因 为 进程 ID 不 会 
coe 改变 。 并 且 ， 除 了 最 初 的 init 进 程 ， 所 有 进程 的 父 进程 ID 

JHL- 

login 能 处 理 多 项 工作 。 因 为 它 得 到 了 用 户 名 ， 所 以 能 调用 
getpwnam ”取得 相应 用 户 的 口令 文件 登录 项 。 然 后 调用 getpass(3) 以 显示 
提示 “Password: ”， 接 着 读 用 户 键 入 的 口令 自然， 禁止 回 显 用 户 键 入 
WO) 。 它 调用 crypt(3) 将 用 户 键 入 的 口令 加 密 ， 并 与 该 用 户 在 阴影 
口令 文件 中 登录 项 的 pw_passwd 字 段 相 比较 。 如 果 用 户 几 次 键入 的 口令 
都 无 效 ， 则 login 以 参数 1 调用 exit 表 示 登 录 过 程 失败 。 父 进程 Gnit) 了 
解 到 子 进程 的 终止 情况 后 ， 将 再 次 调用 fork， 其 后 又 执行 了 getty， 对 此 
终端 重复 上 述 过 程 。 

这 是 UNIX 系 统 传统 的 用 户 身份 验证 过 程 。 现 代 UNIX 系 统 已 发 展 到 
支持 多 个 身份 验证 过 程 。 例 如 ，FreeBSD、Linux、Mac OS X 以 及 
Solaris 都 支持 被 称 为 PAM (Pluggable Authentication Modules， 可 插入 

















的 身份 验证 模块 ) 的 更 加 灵活 的 方案 。PAM 人 允许 管理 人 员 配 置 使 用 何 
种 身份 验证 方法 来 访问 那些 使 用 PAM 库 编写 的 服务 。 

如 果 应 用 程序 需要 验证 用 户 是 否 具有 适当 的 权限 去 执行 某 个 服务 ， 
那么 我 们 要 么 将 有 身份 验证 机 制 编写 到 应 用 中 ， 要 么 使 用 PAM 库 得 到 同样 
的 功能 。 使 用 PAM 的 优点 是 ， 管 理 员 可 以 基于 本 地 策略 、 人 针对 不 同 任务 
配置 不 同 的 验证 用 户 身 份 的 方法 。 

如 果 用 户 正 确 登录 ，login 就 将 完成 如 下 工作 。 

“将 当前 工作 目录 更 改 为 该 用 户 的 起 始 目 录 (chdir) 。 

“调用 chown 更 改 该 终端 的 所 有 权 ， 使 登录 用 户 成 为 它 的 所 有 者 。 

“将 对 该 终端 设备 的 访问 权限 改变 成 * 用 户 读 和 写 ”。 

“调用 setgid 及 initgroups 设 置 进程 的 组 ID。 

“用 login 得 到 的 所 有 信息 初始 化 环境 : 起 始 目录 (HOME) 、 
shell (SHELL) 、 用 户 名 (USER 和 LOGNAME) 以 及 一 个 系统 默认 路 
径 (PATH) 。 

"1ogin 进 程 更 改 为 登录 用 户 的 用 户 ID (setuid) 并 调用 该 用 户 的 登录 
shell， 其 方式 类 似 于 : execl("/bin/sh", "-sh", (char *)0); 

argv[0] 的 第 一 个 字符 负 号 “-?* 是 一 个 标志 ， 表 示 该 shell 被 作为 登录 
shell 调 用 。shell 可 以 查看 此 字符 ， 并 相应 地 修改 其 启动 过 程 。 

login 程 序 实际 所 做 的 比 上 面 说 的 要 多 。 它 可 选择 地 打印 日 期 消 忆 
(message-of-the-day) 文件 、 检 查 新 邮件 以 及 执行 其 他 一 些 任 务 。 本 章 
中 我 们 主要 关心 上 面 所 说 的 功能 。 

回忆 8.11 节 中 对 setuid 函 数 的 讨论 ， 因 为 setuid 是 由 超级 用 户 调 用 
的 ， 它 更 改 所 有 3 个 用 户 ID: 实际 用 户 ID、 有 效用 户 ID 和 保存 的 用 户 
ID。login 在 较 早 时 间 调 用 的 setgid 对 所 有 3 个 组 ID 也 有 同样 效果 。 

至 此 ， 登 录用 户 的 登录 shell 开 始 运 行 。 其 父 进程 ID 是 init 进 程 〈 进 
ID 1) ， 所 以 当 此 登录 shell 终 止 时 ，init 会 得 到 通知 〈 接 到 SIGCHLD 
fas) ， 它 会 对 该 终端 重复 全 部 上 述 过 程 。 登 录 shell 的 文件 描述 符 0、1 
和 2 设置 为 终端 设备 。 图 9-3 显 示 了 这 种 安排 。 





























进程 ID 1 


init 


通过 getty 和 login 


登录 shell 






fd 0,1,2 


终端 设备 驱动 


硬 连接 


图 9-3 终端 登录 完成 各 种 设置 后 的 进程 安排 

现在 ， 登 录 。 shell 读 取 其 启动 文件 (Bourne shell 和 Kormn shell 
是 .profile，GNU Bourne-again shell 是 .bash_profile、.bash_login 
或 .profile， C shell 是 .cshrc 和 .login) 。 这 些 启动 文件 通常 更 改 某 些 环境 
变量 并 增加 很 多 环境 变量 。 例 如 ， 大 多 数 用 户 设 置 他 们 目 己 的 PATH 并 
和 常常 提示 实际 终端 类 型 (TERM) 。 当 执行 完 局 动 文件 后 ， 用 户 最 后 得 
到 shell 提 示 符 ， 并 能 键入 命令 。 

2. Mac OS XX 终端 登录 

Mac OS X 部 分 地 基于 FreeBSD， 上 所 以 其 终端 登录 进程 与 BSD 终 端 登 
录 进 程 的 工作 步骤 基本 相同 。 但 是 ，Mac OS X 有 些 不 同 之 处 。 

*init 的 工作 是 由 launchd 完 成 的 。 

“一 开始 提供 的 就 是 图 形 终端 。 

3. Linux 终 端 登 录 

Linux 的 终端 登录 过 程 非 常 类 似 于 BSD。 确 实 ，Linux login 命 令 是 从 














4.3BSD login 命 令 派 生出 来 的 。BSD 登 录 过 程 与 Linux 登 录 过 程 的 主要 区 
别 在 于 说 明 终端 配置 的 方式 。 

在 System V 的 init 文 件 格式 之 后 ， 有 些 Linux 发 行 版 的 init 程 序 使 用 了 
管理 文件 方式 。 在 这 些 系 统 中 ，/etcinittab 包 含 配置 信息 ， 指 定 了 init 心 
当 为 之 启动 getty 进 程 的 各 终端 设备 。 

其 他 Linux 发 行 版 本 ， 如 最 近 的 Ubuntu 发 行 版 ， 配 有 称 
为 “Upstart” 的 init 程 序 。 使 用 存放 在 /etcwinit 目 录 的 *.conf 命 名 的 配置 文 
件 。 例 如 ， 运 行 /devwtty1 上 的 getty 需 要 的 说 明 可 能 放 在 /etcinittty1.conf 


FFE 

根据 所 使 用 的 getty 版 本 的 不 同 ， 终 端的 特征 要 么 在 命令 行 中 说 明 
(如 agetty) ， 要 么 在 /etc/gettydefs 文 件 中 说 明 (如 mgetty) 。 

4. Solaris 终 端 登录 

Solaris 支 持 两 种 形式 的 终端 登录 a) getty 方 式 ， 这 与 前 面 对 BSD 
终端 登录 的 说 明 一 样 ; C) ttymon 登 录 ， 这 是 SVR4 引 入 的 一 种 新 特 
性 。 通 常 ，getty 用 于 控制 台 ，ttymon 则 用 于 其 他 终端 的 登录 。 

ttymon 命 令 是 服务 访问 设施 (Service Access Facility, SAF) 的 一 部 
分 。SAEF 的 目的 是 用 一 致 的 方式 对 提供 系统 访问 的 服务 进行 管理 《关于 
SAF 的 详细 信息 可 以 参见 Rago[1993] 的 第 6 章 ) 。 按 照 本 书 的 宗 由 ， 我 们 
只 简单 说 明 从 init 到 登录 shell 之 间 不 同 的 工作 步骤 ， 最 后 结果 与 图 9-3 中 
所 示 相 似 。init 是 sac (service access controller， 服 务 访问 控制 器 ) 的 父 
进程 ，sac 调 用 fork， 然 后 ， 当 系统 进入 多 用 户 状 态 时 ， 其 子 进程 执行 
ttymon 程 序 。ttymon 监 控 在 配置 文件 中 列 出 的 所 有 终端 端口 ， 当 用 户 键 
入 登录 名 时 ， 它 调用 一 次 fork。 在 此 之 后 ttymon 的 子 进 程 执 行 login， 
它 同 用 户 发 出 提示 ， 要 求 输入 口令 字 。 一 旦 完成 这 一 处 理 ，login 执 行 登 
录用 户 的 登录 shell， 于 是 到 达 了 图 9-3 中 所 示 的 位 置 。 一 个 区 别 是 用 户 
登录 shell 的 父 进程 现在 是 ttymon， 而 在 getty 登 录 中 ， 登 录 shell 的 父 进程 
是 init。 











通过 串 行 终端 登录 至 系统 和 经 由 网 络 登 录 至 系统 两 者 之 间 的 主要 
(物理 上 的 ) 区 别 是 : 网 络 登 录 时 ， 在 终端 和 计算 机 之 间 的 连接 不 再 是 
点 到 点 的 。 在 网 络 登 录 情 况 下 ，login 仅 仅 是 一 种 可 用 的 服务 ， 这 与 其 他 
网 络 服务 (如 FTP 或 SMTP) 的 性 质 相 同 。 

在 上 节 所 述 的 终端 登录 中 ，init 知 道 哪些 终端 设备 可 用 来 进行 登 
录 ， 并 为 每 个 设备 生成 一 个 getty 进 程 。 但 是 ， 对 网 络 登录 情况 则 有 上 所 不 
同 ， 所 有 登录 都 经 由 内 核 的 网 络 接口 驱动 程序 〈 如 以 太 网 驱动 程序 ) ， 
而 且 事先 并 不 知道 将 会 有 多 少 这 样 的 登录 。 因 此 必须 等 待 一 个 网 络 连 接 
请 求 的 到 达 ， 而 不 是 使 一 个 进程 等 竺 每 一 个 可 能 的 登录 。 

为 使 同一 个 软件 既 能 处 理 终端 登录 ， 又 能 处 理 网 络 登录 ， 系 统 使 用 
了 一 种 称 为 伪 终 端 (pseudo terminal) 的 软件 驱动 程序 ， 它 仿真 串 行 终 
端的 运行 行为 ， 并 将 终端 操作 映射 为 网 络 操 作 ， 反 之 亦 然 。〔 在 第 19 
半 ， 我 们 将 详细 说 明 伪 终端 。) 

1. BSD 网 络 登录 

在 BSD 中 ， 有 一 个 inetd 进 程 〈《 有 时 称 为 因特网 超级 服务 器 ) ， 它 等 
待 大 多 数 网 络 连 接 。 本 节 将 说 明 BSD 网 络 登录 中 所 涉及 的 进程 序列 。 
关于 这 些 进 程 的 网 络 程序 设计 方面 的 细节 请 参 疯 Stevens、EFenner 和 
Rudoff [2004]. 

作为 系统 局 动 的 一 部 分 ，init 调 用 一 个 shell， 使 其 执行 shell 脚 
本 /etc/rc。 由 此 shell 脚 本 启动 一 个 守护 进程 inetd。 一 旦 此 shell 脚 本 终 
止 ，inetd 的 父 进 程 就 变 成 init。inetd 等 待 TCP/IP 连 接 请 求 到 达 主 机 ， 而 
ae ， 它 执行 一 次 fork， 然 后 生成 的 子 进程 exec 适 当 
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假定 一 个 对 于 TELNET 服 务 进程 的 TCP 连 接 请 求 到 达 。TELNET 是 
使 用 TCP 协 议 的 远程 登录 应 用 程序 。 在 另 一 台 主 机 ( 它 通过 某 种 形式 的 
网 络 与 服务 进程 主机 相连 接 ) 上 的 用 户 ， 或 在 同一 个 主机 上 的 一 个 用 户 
启动 TELNET 客 户 进程 ， 由 此 启动 登录 过 程 : 

telnet hostname 

该 客户 进程 打开 一 个 到 hostname 主 机 的 TCP 连 接 ， 在 hostname 主 机 
上 启动 的 程序 被 称 为 TELNET 服 务 进程 。 然 后 ， 客 户 进 程 和 服务 进程 之 
间 使 用 TELNET 应 用 协议 通过 TCP 连 接 交 换 数据 。 局 动 客户 进程 的 用 户 
现在 登录 到 了 服务 进程 所 在 的 主机 (当然 ， 假 定 用 户 在 服务 进程 主机 上 























有 一 个 有 效 的 账号 ) 。 图 9-4 显 示 了 在 执行 TELNET 服 务 进程 〈 称 为 
telnetd) 中 所 涉及 的 进程 序列 。 


进程 ID 1 


init 


/bin/sh 中 的 fork/exec, 


系统 出 现 多 用 户 时 ， 
执行 Shell 脚本 etc/rc 


从 TELNET 客户 进程 来 的 
TCP 连接 请 求 





l fork 从 TELNET 客户 进程 来 
的 连接 请 求 到 达 时 





图 9-4 执行 TELNET 服 务 进程 时 调用 的 进程 序列 

















然后 ，telnetd 进 程 打 开 一 个 伪 终 端 设 备 ， 并 用 fork 分 成 两 个 进程 。 
父 进 程 处 理 通 过 网 络 连 接 的 通信 ， 子 进程 则 执行 login 程 序 。 父 进程 和 子 
进程 通过 伪 终 端 相 连接 。 在 调用 exec 之 前 ， 子 进程 使 其 文件 描述 符 0、 
1、2 与 伪 终 痢 相 连 。 如 果 登 录 正 确 ，login 就 执行 9.2 市 中 所 述 的 同样 步 
又 一 更 改 当 前 工作 目录 为 起 始 目录 、 设 置 登录 用 户 的 组 ID、 用 户 ID 以 及 
初始 环境 。 然 后 login 调 用 exec 将 其 目 身 从 换 为 登录 用 户 的 登录 shell。 图 
9-5 显 示 了 到 达 这 一 点 时 的 进程 安排 。 








进程 ID 1 


通过 inetd, telnetd, 


All login 


登录 shell 






fd 0, 1, 2 


通过 telneta 服务 和 
telnet 客户 的 网 络 链接 





图 9-5 网 络 登录 完成 各 种 设置 后 的 进程 安排 

很 明显 ， 在 伪 终 端 设备 驱动 程序 和 实际 终端 用 户 之 间 进 行 了 很 多 工 
第 19 章 详细 说 明 伪 终端 时 ， 我 们 将 介绍 与 这 种 安排 相关 的 所 有 进 
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需要 理解 的 重点 是 : 当 通 过 终端 ( 见 图 9-3) 或 网 络 ( 见 图 9-5) & 
录 时 ， 我 们 得 到 一 个 登录 shell， 其 标准 输入 、 标 准 输出 和 标准 错误 要 么 
连接 到 一 个 终端 设备 ， 要 么 连接 到 一 个 伪 终 端 设备 上 。 在 后 面 几 节 中 我 
们 会 了 解 到 这 一 登录 shell 是 一 个 POSIX.1 会 话 的 开始 ， 而 此 终端 或 伪 终 
端 则 是 会 话 的 控制 终端 。 

2. Mac OS X 网 络 登 录 

Mac OS X 是 部 分 地 基于 FreeBSD 的 ， 所 以 其 网 络 登 录 与 BSD 网 络 登 
录 基 本 相同 。 但 Mac OS X 上 telnet 和 守护 进程 是 从 launchd 运 行 的 。 

telnet 守 护 进 程 在 Mac OS X 中 默认 是 禁用 的 《虽然 可 以 通过 














launchctl(1) 命 令 启 用 ) 。Mac OS X 上 执行 网 络 登 录 的 更 好 办 法 是 用 使 
ssh 〈 安 全 shell 命 令 ) 。 

3. Linux 网 络 登 录 

除了 有 些 版 本 使 用 扩展 的 因特网 服务 守护 进程 xinetd 人 代替 inetd 进 程 
外 ，Linux 网 络 登 录 的 其 他 方面 与 BSD 网 络 登 录 相 同 。xinetd 进 程 对 它 所 
启动 的 各 种 服务 的 控制 比 inetd 提 供 的 控制 更 加 精细 。 

4. Solaris 网 络 登 录 

Solaris 中 网 络 登录 的 工作 过 程 与 BSD 和 Linux 中 的 步骤 几乎 一 样 。 同 
样 使 用 了 类 似 于 BSD 版 的 inetd 服 务 进程 ， 但 是 在 Solaris 中 ，inetd 服 务 进 
程 在 服务 管理 设施 (Service Management Facility, SMF) 下 作为 restarter 
运行 。 这 个 restarter 是 守护 进程 ， 它 负责 启动 和 监视 其 他 守护 进程 ， 如 
果 其 他 守护 进程 失败 的 话 ，restarter 重 启 这 些 失 效 进 程 。 虽 然 inetd 服务 
程序 由 SMF 中 的 主 restarter 启 动 ， 但 实际 上 主 restarter 是 由 init 程 序 启动 
的 ， 最 后 得 到 的 结果 与 图 9-5 中 一 样 。 

Solaris 服 务 管理 设施 是 管理 和 监视 系统 服务 的 框架 ， 提 供 了 一 种 从 
影响 系统 服务 的 故障 中 恢复 的 途径 。 关 于 服务 管理 设施 的 更 多 内 容 ， 可 
参阅 Adams[2005] 以 及 Solaris 系 统 手册 smf(5) 和 inetd(1M)。 








9.4 进程 


每 个 进程 除了 有 一 进程 ID 之 外 ， 还 属于 一 个 进程 组 ， 第 10 章 讨论 信 
号 时 还 会 涉及 进程 组 。 

进程 组 是 一 个 或 多 个 进程 的 集合 。 通 常 ， 它 们 是 在 同一 作业 中 结合 
起 来 的 《9.8 节 将 详细 讨论 作业 控制 ) ， 同 一 进程 组 中 的 各 进程 接收 来 
自 同一 终端 的 各 种 信号 。 每 个 进程 组 有 一 个 唯一 的 进程 组 ID。 进 程 组 ID 
类 似 于 进程 DD 一 一 它 是 一 个 正 整 数 ， 并 可 存放 在 pid_t 数 据 类 型 中 。 也 数 
getpgrp 返 回调 用 进程 的 进程 组 ID。 

#include <unistd.h> 

pid_t getpgrp(void); 











返回 值 : 调用 进程 的 进程 组 ID 
在 早期 BSD 派生 的 系统 中 ， 该 函数 的 参数 是 pid， 返 回 该 进程 的 进 
程 组 ID. Single UNIX Specification 定义 了 getpgid 函 数 模仿 此 种 运行 行 


#include <unistd.h> 
pid_t getpgid(pid_t pid); 
返回 值 : 大 成 功 ， 返 回 进程 组 ID; 各 出 错 ， 返 回 -1 
丰 pid 是 0， 返 回调 用 进程 的 进程 组 ID， 于 是 ， 
getpgid(0); 
等 价 于 
getpgrp(); 
每 个 进程 组 有 一 个 组 长 进程 。 组 长 进程 的 进程 组 ID 等 于 其 进程 ID。 
进程 组 组 长 可 以 创建 一 个 进程 组 、 创 建 该 组 中 的 进程 ， 然 后 终止。 
只 要 在 某 个 进程 组 中 有 一 个 进程 存在 ， 则 该 进程 组 就 存在 ， 这 与 其 组 长 
进程 是 否 终止 无 天。 从 进程 组 创建 开始 到 其 中 最 后 一 个 进程 离开 为 止 的 
时 间 区 间 称 为 进程 组 的 生命 期 。 某 个 进程 组 中 的 最 后 一 个 进程 可 以 终 
止 ， 也 可 以 转移 到 另 一 个 进程 组 。 
进程 调用 setpgid 可 以 加 入 一 个 现 有 的 进程 组 或 者 创建 一 个 新 进程 
组 〈 下 一 节 中 将 说 明 用 setsid 也 可 以 创建 一 个 新 的 进程 组 ) 。 
#include <unistd.h> 
int setpgid(pid_t pid, pid_t pgid); 
返回 值 : ERJ, Wel; FRE, Re- 
setpgid 函 数 将 pid 进 程 的 进程 组 ID 设置 为 pgid。 如 果 这 两 个 参数 相 





等 ， 则 由 pid 指 定 的 进程 变 成 进程 组 组 长 。 如 果 pid 是 0， 则 使 用 调用 者 的 
进程 ID。 另 外 ， 如 果 pgid 是 0， 则 由 pid 指 定 的 进程 ID 用 作 进 程 组 ID。 

一 个 进程 只 能 为 它 自己 或 它 的 子 进 程 设置 进程 组 ID。 在 它 的 子 进 程 
调用 了 exec 后 ， 它 就 不 再 更 改 该 子 进程 的 进程 组 ID。 

在 大 多 数 作 业 控 制 shell 中 ， 在 fork 之 后 调用 此 函数 ， 使 父 进程 设置 
其 子 进程 的 进程 组 ID， 并 且 也 使 子 进程 设置 其 自己 的 进程 组 ID。 这 两 个 
调用 中 有 一 个 是 匈 余 的 ， 但 让 父 进程 和 子 进程 都 这 样 做 可 以 保证 ， 在 父 
进程 和 子 进程 认为 子 进程 已 进入 了 该 进程 组 之 前 ， 这 确实 已 经 发 生 了 。 
如 果 不 这 样 做 ， 在 fork 之 后 ， 由 于 父 进程 和 子 进 程 运 行 的 先后 次 序 不 确 
Re eee ee oe E E eae 

在 讨论 信号 时 ， 将 说 明 如 何 将 一 个 信号 发 送 给 一 个 进程 〈 由 其 进程 
ID 标识 ) 或 发 送 给 一 个 进程 组 〈 由 进程 组 ID 标识 ) 。 类 似 地 ，8.6 节 的 
waitpid 函 数 可 被 用 来 等 待 一 个 进程 或 者 指定 进程 组 中 的 一 个 进程 终止 。 
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9.5 会 


会 话 (session) 是 一 个 或 多 个 进程 组 的 集合 。 例 如 ， 可 以 具有 图 9- 
6 中 所 示 的 安排 。 其 中 ， 在 一 个 会 话 中 有 3 个 进程 组 。 
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图 9-6 进程 组 和 会 话 中 的 进程 安排 
通常 是 由 shell 的 管道 将 几 个 进程 编 成 一 组 的 。 例 如 ， 图 9-6 中 的 安 
排 可 能 是 由 下 列 形式 的 shell 命 令 形 成 的 : 
procl | proc2 & 
proc3 | proc4 | procs 
进程 调用 setsid 函 数 建立 一 个 新 会 话 。 
#include <unistd.h> 
pid_t setsid(void); 
返回 值 : 知 成 功 ， 返 回 进 程 组 ID; 知 出 错 ， 返 回 -1 
如 果 调 用 此 函数 的 进程 不 是 一 个 进程 组 的 组 长 ， 则 此 函数 创建 一 个 
新 会 话 。 有 具体 会 友 生 以 下 3 件 事 。 
(1) 该 进程 变 成 新 会 话 的 会 话 首 进程 〈session leader， 会 话 首 进程 
是 创建 该 会 话 的 进程 ) 。 此 时 ， 该 进程 是 新 会 话 中 的 唯一 进程 。 








(2) 该 进程 成 为 一 个 新 进程 组 的 组 长 进程 。 新 进程 组 ID 是 该 调用 
进程 的 进程 ID。 

(3) 该 进程 没有 控制 终端 《〈 下 一 节 讨论 控制 终端 ) 。 如 果 在 调用 
setsid 之 前 该 进程 有 一 个 控制 终端 ， 那 么 这 种 联系 也 被 切断 。 

如 果 该 调用 进程 已 经 是 一 个 进程 组 的 组 长 ， 则 此 函数 返回 出 错 。 为 
了 保证 不 处 于 这 种 情况 ， 通 常 先 调用 fork， 然 后 使 其 父 进程 终止 ， 而 子 
进程 则 继续 。 因 为 子 进 程 继 承 了 父 进程 的 进程 组 ID， 而 其 进程 ID 则 是 新 
分 配 的 ， 两 者 不 可 能 相等 ， 这 就 保证 了 子 进程 不 是 一 个 进程 组 的 组 长 。 

Single UNIX Specification 只 说 明了 会 话 首 进程 ， 而 没有 类 似 于 进程 
ID 和 进程 组 ID 的 会 话 ID。 显 然 ， 会 话 首 进 程 是 具有 唯一 进程 ID 的 单个 
进程 ， 所 以 可 以 将 会 话 首 进程 的 进程 ID 视 为 会 话 ID。 会 话 ID 这 一 概念 是 
由 SVR4 引 入 的 。 历 史上 ， 基 于 BSD 的 系统 并 不 支持 这 个 概念 ， 但 后 来 
改 弦 易 统 也 支持 了 会 话 ID。getsid 函 数 返 回 会 话 首 进程 的 进程 组 ID。 

一 些 实现 (如 Solaris) 与 Single UNIX Specification 保 持 一 致 ， 在 实 
践 中 避免 使 用 “会 话 ID?” 这 一 短语 ， 而 是 将 此 称 为 “会 话 首 进程 的 进程 组 
ID”。 会 话 首 进程 总 是 一 个 进程 组 的 组 长 进程 ， 所 以 两 者 是 等 价 的 。 

#include <unistd.h> 

pid_t getsid(pid_t pid); 

BREE: 大 成 功 ， 返 回 会 话 自 进程 的 进程 组 ID; 大 出 错 ， 返 回 -1 

如 若 pid 是 0，getsid 返 回调 用 进程 的 会 话 首 进 程 的 进程 组 ID。 出 于 
安全 方面 的 考虑 ， 一 些 实 现 有 如 下 限制 : 如 知 pid 并 不 属于 调用 者 所 在 
的 会 话 ， 那 么 调用 进程 就 不 能 得 到 该 会 话 首 进程 的 进程 组 ID。 



































9.6 控制 终端 


会 话 和 进程 组 还 有 一 些 其 他 特性 。 

“一 个 会 话 可 以 有 一 个 控制 终端 Ccontrolling terminal) 。 这 通常 是 
终端 设备 (在 终端 登录 情况 下 )〉 或 伪 终 端 设 备 〈 在 网 络 登录 情况 下 ) 。 

“建立 与 控制 终端 连接 的 会 话 首 进程 被 称 为 控制 进程 (controlling 
process) 。 

一 个 会 话 中 的 几 个 进程 组 可 被 分 成 一 个 前 台 进 程 组 (foreground 
process group〉 以 及 一 个 或 多 个 后 台 进 程 组 (background process 


group) 。 
“如 采 一 个 会 话 有 一 个 控制 终端 ， 则 它 有 一 个 前 台 进 程 组 ， 其 他 进 
用 组 为 后 台 进 程 组 。 


“无 论 何 时 键入 终端 的 中 断 键 “常常 是 Delete 或 Crl+C) ， 都 会 将 中 
断 信 号 发 送 至 前 台 进 程 组 的 所 有 进程 。 

。 无 论 何 时 键入 终端 的 退出 键 《〈 第 利 是 Ctrl+\) ， 都 会 将 退出 信号 发 
送 至 前 台 进 程 组 的 所 有 进程 。 

© 如 果 终 站 接口 检测 到 调制 解 调 器 (或 网 络 ) 已 经 断 开 连接 ， 则 将 
挂 断 信 号 发 送 至 控制 进程 《会 话 首 进 程 ) 。 

这 些 特性 示 于 图 9-7 中 。 
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图 9-7 进程 组 、 会 话 和 控制 终端 
通常 ， 我 们 不 必 担 心 控制 终端 ， 登 录 时 ， 将 自动 建立 控制 终端 。 








POSIX.1 将 如 何 分 配 一 个 控制 终端 的 机 制 交 给 具体 实现 来 选择 。 
19.4 节 中 将 说 明 实 际 步骤 。 

当 会 话 首 进程 打开 第 一 个 尚未 与 一 个 会 话 相 关联 的 终端 设备 时 ， 只 
要 在 调用 open 时 没有 指定 O_NOCTTY 标 志 ( 见 3.3 节 ) ，System V 派 生 
的 系统 将 此 作为 控制 终端 分 配给 此 会 话 。 

当 会 话 首 进程 用 TIOCSCTTY 作 为 request 参 数 〈( 第 三 个 参数 是 空 指 
针 ) 调用 ioctl 时 ， 基 于 BSD 的 系统 为 会 话 分 配 控制 终端 。 为 使 此 调用 成 














功 执行 ， 此 会 话 不 能 已 经 有 一 个 控制 终端 (通常 ioctl 调 用 紧 跟 在 setsid 调 
用 之 后 ， see dee 一 个 没有 控制 终端 的 会 话 首 进程 ) 。 除 了 
以 兼容 模式 文 持 其 他 系统 以 外 ， 基 于 BSD 的 系统 不 使 用 pOSIX.1 中 对 
open 函 数 所 说 明 的 O_NOCTTY 标 志 。 

图 9-8 总 结 了 本 书 讨论 的 4 个 平台 分 配 控制 终端 的 方式 。 注 意 ， 虽 然 
Mac OS X 10.6.8 是 从 BSD 派 生出 来 的 ， 但 其 分 配 控制 终端 的 方式 如 同 
System V 。 


ED FreeBSD 8.0 | Linux 3.2.0 | Mac OS X 10.6.8 | Solaris 10 
没有 指定 0 NOCTTY 的 open 
TIOCSCTTY ioctl 命令 


图 9-8 不 同 的 实现 分 配 控 制 终端 的 方式 

有 时 不 电 标 准 输 入 、 标准 输出 是 否 重 定 同 ， 程 序 都 要 与 控制 终端 交 
互 作 用 。 保 证 程序 能 与 控制 终端 对 话 的 方法 是 open 文件 /dewtty。 在 内 
核 中 ， 此 特殊 文件 是 控制 终端 出 的 同 义 语 。 自 然 地 ， 如 果 程 序 没 有 控制 终 
端 ， 则 对 于 此 设备 的 open 将 失败 。 

典型 的 例子 是 用 于 读 口 令 的 getpass(3) PK% (终端 回 显 被 关闭 ) 。 

EO 函数 由 crypt(1) 程 序 调用 ， 并 可 用 于 管道 中 。 例如 ， 

crypt < salaries | lpr 

将 文件 salaries 解密， 然后 经 由 管道 将 输出 送 至 打印 缓冲 服务 程 
序 。 因 为 crypt 从 其 标准 输入 读 输 入 文件 ， 所 以 标准 输入 不 能 用 于 输入 
口令 。 而 且 ，crypt 经 过 了 设计 ， 因 此 每 次 运行 此 程序 时 都 应 输入 加 密 口 
这 样 也 就 阻止 了 用 户 将 口令 存放 在 文件 中 〈 这 会 造成 安全 性 漏 
洞 ) 。 

已 经 知道 有 一 些 方法 可 以 破译 crypt 程序 使 用 的 密码 。 关 于 加 密 文 
件 的 详细 情况 请 参见 Garfinkel 等 [2003]。 














9.7 pki Wtcgetperp. 、tcsetpgrp 和 tcgetsid 


需要 有 一 种 方法 来 通知 内 核 哪 一 个 进程 组 是 前 台 进 程 组 ， 这 样 ， 终 
ee 能 知道 将 终端 输入 和 终端 产生 的 信号 发 送 到 何 处 〈 见 
9-7) 。 
#include <unistd.h> 
pid_t tcgetpgrp(int fd); 
int tcsetpgrp(int fd, pid_t pgrpid); 
返回 值 : 知 成 功 ， 返 回 前 台 进 程 组 ID; 知 出 错 ， 返 回 -1 
返回 值 : HRD, 返回 0; 若 出 错 ， 返 回 -1 
函数 tcgetpgrp 返 回 前 台 进 程 组 ID， 它 与 在 fd 上 打开 的 终端 相关 联 。 
如 果 进 程 有 一 个 控制 终端 ， 则 该 进程 可 以 调用 tcsetpgrp 将 前 台 进 程 
组 ID 设置 为 pgrpid。pgrpid 值 应 当 是 在 同一 会 话 中 的 一 个 进程 组 的 ID 。fd 
必须 引用 该 会 话 的 控制 终端 。 
大 多 数 应 用 程序 并 不 直接 调用 这 两 个 函数 。 它 们 通常 由 作业 控制 
shell 调 用 。 
给 出 控制 TTY 的 文件 描述 符 ， 通 过 tcgetsid 函 数 ， 应 用 程序 就 能 获得 
会 话 首 进 程 的 进程 组 ID。 
#include <termios.h> 
pid_t tcgetsid(int fd); 
BEE: ARH, Zi REREAD; ers, el- 
需要 管理 控制 终端 的 应 用 程序 可 以 调用 tcgetsid 函数 识别 出 控制 终 
端的 会 话 首 进程 的 会 话 ID 〈 它 等 价 于 会 话 首 进程 的 进 站 程 组 ID) 。 





9.8 (EME FF til 


作业 控制 是 BSD 在 1980 年 左右 增加 的 一 个 特性 。 它 允许 在 一 个 终端 
上 启动 多 个 作业 (进程 组 )， 它 控制 哪 一 个 作业 可 以 访问 该 终端 以 及 哪 
些 作业 在 后 台 运 行 。 作 业 控 制 要 求 以 下 3 种 形式 的 支持 。 

(1) 支持 作业 控制 的 shell。 

(2) 内核 中 的 终端 驱动 程序 必须 文 持 作业 控制 。 

C3) 内 核 必须 提供 对 某 些 作业 控制 信号 的 文 持 。 

SVR3 提 供 了 一 种 不 同 的 作业 控制 ， 称 为 shell 层 (shell layer) 。 但 
是 POSIX.1 选 择 了 BSD 形 式 的 作业 控制 ， 这 也 是 我 们 在 这 里 所 说 明 的 。 
POSIX.1 的 早期 版 本 中 ， 对 作业 控制 的 文 持 是 可 选择 的 ， 现 在 则 要 求 所 
有 平台 都 文 持 它 。 

从 shell 使 用 作业 控制 功能 的 角度 观察 ， 用 户 可 以 在 前 台 或 后 台 启 动 
"a a a a 
H: 








vi main.c 

在 前 台 启 动 了 只 有 一 个 进程 组 成 的 作业 。 下 面 的 命令 : 
pr *.c | lpr & 

make all & 


在 后 台 启 动 了 两 个 作业 。 这 两 个 后 台 作 业 调 用 的 所 有 进程 都 在 后 台 
运行 。 

如 前 所 述 ， 我 们 需要 一 个 支持 作业 控制 的 shell 以 使 用 由 作业 控制 提 
供 的 功能 。 对 于 早期 的 系统 ，shel] 是 人 否 文 持 作业 控制 比较 易于 说 明 。C 
shell 支 持 作业 控制 ，Bourne shell 不 支持 ， 而 Korn shell 能 否 支 持 作 业 控 制 
取决 于 主机 是 否 支 持 作 业 控 制 。 但 是 现在 C _ shell 已 被 移植 到 并 不 文 持 作 
业 控 制 的 系统 上 《如 System V 的 早期 版 本 ) ， 而 当 用 名 字 jsh 而 不 是 用 sh 
调用 SVR4 中 的 Bourne shell 时 ， 它 支持 作业 控制 。 如 果 主 机 文 持 作业 控 
制 ， 则 Korn shell 继 续 文 持 作 业 控 制 。Bourne-again ”shell 也 支持 作业 控 
制 。 各 种 shell 之 间 的 差别 无 关 紧 要 时 ， 我 们 将 只 是 一 般 地 说 明文 持 作业 
控制 的 shell 和 不 支持 作业 控制 的 shell。 

当 启 动 一 个 后 台 作 业 时 ，shell 赋 予 它 一 个 作业 标识 符 ， 并 打印 一 个 
或 多 个 进程 ID。 下 面 的 脚本 显示 了 Korn shell 是 如 何 处 理 这 一 点 的 。 

$ make all > Make.out & 

[1] 1475 


[2] 1490 
$ pr *.c | lpr & 
$ 


键入 回 车 
[2] + Done pr *.c | lpr & 
[1] + Done make all > Make.out & 


make 是 作业 编号 1， 所 启动 的 进程 ID 是 1475。 下 一 个 管道 是 作业 编 
号 2， 其 第 一 个 进程 的 进程 ID 是 1490。 当 作业 完成 而 且 键 入 回 车 时 ， 
shell 通 知 作 业已 经 完成 。 键 入 回 车 是 为 了 让 shell 打 印 其 提示 符 。shell 并 
不 在 任意 时 刻 打 印 后 台 作 业 的 状态 改变 一 一 它 只 在 打印 其 提示 符 让 用 户 
输入 新 的 命令 行 之 前 才 这 样 做 。 如 果 不 这 样 处 理 ， 则 当 我 们 正 输入 一 行 
时 ， 它 也 可 能 输出 ， 于 是 ， 就 会 引起 混乱 。 

我 们 可 以 键入 一 个 影响 前 台 作 业 的 特殊 字符 一 一 挂 起 键 (通常 采用 
Ctrl+Z) ， 与 终端 驱动 程序 进行 交互 作用 。 键 入 此 字符 使 终端 驱动 程序 
将 信号 SIGTSTP 发 送 至 前 台 进 程 组 中 的 所 有 进程 ， 后 台 进 程 组 作业 则 不 
受 影 响 。 实 际 上 有 3 个 特殊 字符 可 使 终端 驱动 程序 产生 信号 ， 并 将 它们 
发 送 至 前 台 进 程 组 ， 它 们 是 : 

中断 字符 (一 般 采 用 Delete 或 Ctrl+C)〉 产生 SIGINT:; 

“退出 字符 “〈 一 般 采 用 Ctrl+\) 产生 SIGQUIT; 

。 挂 起 字符 “〈 一 般 采 用 Ctrl+Z) 产生 SIGTSTP。 

第 18 章 中 将 说 明 可 将 这 3 个 字符 更 改 为 用 户 选 择 的 任意 其 他 字 
符 ， 以 及 如 何 使 终端 驱动 程序 不 处 理 这 些 特殊 字符 。 

终端 驱动 程序 必须 处 理 与 作业 控制 有 关 的 另 一 种 情况 。 我 们 可 以 有 
一 个 前 台 作 业 ， 若 干 个 后 台 作 业 ， 这 些 作业 中 哪 一 个 接收 我 们 在 终端 上 
键入 的 字符 呢 ? 只 有 前 台 作 业 接 收 终 端 输入 。 如 果 后 台 作 业 试 图 读 终 
端 ， 这 并 不 是 一 个 错误 ， 但 是 终端 驱动 程序 将 检测 这 种 情况 ， 并 且 癌 后 
台 作 业 发 送 一 个 特定 信和 号 SIGTTIN。 该 信号 通常 会 停止 此 后 台 作 业 ， 而 
shell 则 向 有 关 用 户 发 出 这 种 情况 的 通知 ， 然 后 用 户 就 可 用 shell 命 令 将 此 
人 


























$ cat > temp.foo & 在 后 人 台 局 动 ， 但 将 从 标准 输入 读 

[1] 1681 

$ 键入 回 车 

[1] + Stopped (SIGTTIN) cat > temp.foo & 

$ fg %1 使 1 号 作业 成 为 前 台 作 业 

cat > temp.foo shell 告 诉 我 们 现在 哪 一 个 作业 在 
HUG 


hello, world 输入 一 行 


AD 键入 文件 结束 符 

$ cat temp.foo 检查 该 行 已 送 入 文件 

hello, world 

注意 ， 这 个 例子 在 Mac OS X 10.6.8 上 不 起 作用 。 在 试图 把 cat 命 令 放 
到 前 台 时 ，read 返 回 失 败 ， 并 将 errno 设 为 EINTR。Mac OS XX 是 基于 
FreeBSD 的 ， 在 FreeBSD 下 本 例 运 行 恨 好 ， 因 此 这 应 该 是 Mac OS X 的 一 
个 bug。 

shell] 在 后 人 台 局 动 cat 进 程 ， 但 是 当 cat 试 图 读 其 标准 输入 《控制 终 
端 ) 时 ， 终 端 驱 动 程序 知道 它 是 个 后 台 作 业 ， 于 是 将 SIGTTIN 信 和 号 送 至 
该 后 台 作 业 。shell 检 测 到 其 子 进 程 的 状态 改变 (回忆 8.6 节 中 对 wait 和 
waitpid 函数 的 讨论 ) ， 并 通知 我 们 该 作业 已 被 停止 。 然 后 ， 我 们 用 shell 
的 fg 命令 将 此 停止 的 作业 送 入 前 台 运 行 〈( 关 于 作业 控制 命令 ， 如 fg 和 bg 
的 详细 情况 ， 以 及 标识 不 同 作业 的 各 种 方法 请 参阅 有 关 shell 的 手册 
页 ) 。 这 样 做 使 shell 将 此 作业 转 为 前 台 进 程 组 〈tcsetpgrp) ， 并 将 继续 
信号 (SIGCONT) 送 给 该 进程 组 。 因 为 该 作业 现在 前 台 进 程 组 中 ， 所 
以 它 可 以 读 控制 终端 。 

如 果 后 人 台 作 业 输 出 到 控制 终端 又 将 发 生 什 么 呢 ? 这 是 一 个 我 们 可 以 
允许 或 禁止 的 选项 。 通 常 ， 可 以 用 stty(T) 命 令 改 变 这 一 选项 〈 第 18 章 将 
说 明 在 程序 中 如 何 改 变 这 一 选项 ) 。 下 面 显示 了 这 种 操作 过 程 : 





$ cat temp.foo & 在 后 台 执 行 

[1] 1719 

$ hello, world 提示 符 后 出 现 后 台 作 业 的 输出 键入 回 车 
[1] + Done cat temp.foo & 

$ stty tostop 禁止 后 台 作 业 输 出 至 控制 终端 

$ cat temp.foo & 在 后 台 再 试 一 次 

[1] 1721 

$ 键入 回 车 ， 发 现 作 业已 停止 

[1] + Stopped(SIGTTOU) cat temp.foo & 

$ fg %1 在 前 台 恢 复 俘 止 的 作业 

cat temp.foo shell 告 诉 我 们 现在 哪 一 个 作业 在 前 台 
hello, world 这 是 该 作业 的 输出 


在 用 户 禁 止 后 台 作 业 向 控制 终端 写 时 ， 该 作业 的 cat 命 令 试图 写 其 标 
准 输出 ， 此 时 ， 终 端 驱动 程序 识别 出 该 写 操作 来 自 于 后 台 进 程 ， 于 是 向 
该 作业 发 送 SIGTTOU 信 和 号，cat 进 程 阻 塞 。 与 上 面 的 例子 一 样 ， 当 用 户 
使 用 shell 的 fg 命令 将 该 作业 转 为 前 台 时 ， 该 作业 继续 执行 直至 完成 。 

图 9-9 总 结 了 前 面 已 说 明 的 作业 控制 的 某 些 功能 。 穿 过 终端 驱动 程 
序 框 的 实 线 表 明 终 端 IO 301 和 终端 产生 的 信号 总 是 从 前 台 进 程 组 连接 








到 实际 终端 。 对 应 于 SIGTTOU 信号 的 虚线 表明 后 台 进 程 组 进程 的 输出 
是 否 出 现在 终端 是 可 选择 的 。 


init,inetd 或 launchd 





getty 或 
telnetd 


在 setsid 后 , exec 
建立 控制 终端 











图 9-9 对 于 前 台 、 后 台 作业 以 及 终端 驱动 程序 的 作业 控制 功能 总 结 

是 否 需 要 作业 控制 是 一 个 有 争议 的 问题 。 作 业 控 制 是 在 窗口 终端 广 

泛 得 到 应 用 之 前 设计 和 实现 的 。 很 多 人 认为 设计 得 好 的 窗口 系统 已 经 免 

除了 对 作业 控制 的 需要 。 某 些 人 抱怨 作业 控制 的 实现 要 求 得 到 内 核 、 终 

端 驱动 程序 、shell 以 及 某 些 应 用 程序 的 支持 ， 是 吃力 不 讨好 的 事情 。 某 

些 人 在 窗口 系统 中 使 用 作业 控制 ， 他 们 认为 两 者 都 需要 。 不 管 你 的 意见 
如 何 ， 作 业 控 制 都 是 POSIX.1 要 求 的 部 分 。 








9.9 shell 执 行程 序 


让 我 们 检验 一 下 shell 是 如 何 执行 程序 的 ， 以 及 这 与 进程 组 、 控 制 终 
端 和 会 话 等 概念 的 关系 。 为 此 ， 再 次 使 用 ps 命令 。 

首先 使 用 不 文 持 作 业 控制 的 、 在 Solaris 上 运行 的 经 典 Bourne shell. 
如 果 执 行 

ps -0 a 

则 其 输出 可 能 是 : 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 

1774 949 949 949 ps 

ps 的 父 进 程 是 shell， 这 正 是 我 们 所 期 望 的 。shell 和 ps 命令 两 者 位 于 
同一 会 话 和 前 台 进 程 组 (949) 中 。 因为 我 们 是 用 一 个 不 文 持 作业 控制 
的 shell 执 行 命令 时 得 到 该 值 的 ， 所 以 称 其 为 前 台 进 程 组 。 

某 些 平台 文 持 一 个 选项 ， 它 使 ps(]) 命 令 打 印 与 会 话 控制 终端 相关 
联 的 进程 组 ”ID。 该 值 在 TPGID 列 中 显示 。 遗憾 的 是 ，ps(1) 命 令 的 输出 
在 各 个 UNIX 版 本 中 都 有 所 不 同 。 例 如 ，Solaris 10 个 文 持 该 选项 。 TE 
FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8'7, MS 

ps -o pid, ppid, pgid, sid, prie comm 

准确 地 打印 我 们 想 要 的 信息 

注意 ， 将 进程 与 终端 进程 组 ID CTPGID 列 ) 关联 起 来 有 点 用 词 不 
当 。 进 程 并 没有 终端 进程 控制 组 。 进 程 属 于 一 个 进程 组 ， 而 进程 组 属于 
一 个 会 话 。 会 话 可 能 有 也 可 能 没有 控制 终端 它 确 实 有 一 个 控制 终 
端 ， 则 此 终端 设备 知道 其 前 台 进 程 的 进 HEHID. — fe Ay 以 用 tcsetpgrp 
函数 在 终 疹 驱动 程序 中 设置 〈 见 网 9-9) 。 前 台 进 TIDRA 和 出 的 一 个 
属性 ， 而 不 是 进程 的 属性 。 取 自 终 六 涯 设 备 驱动 程序 的 该 值 是 ps 在 TPGID 
列 中 打印 的 值 。 pee ee 则 它 在 该 列 打印 0 或 
者 -1， 具 体 值 因 不 同 平台 

因果 在 后 台 执行 命令， 

ps -0 pid,ppid,pgid,sid,comm & 

则 唯一 改变 的 值 是 命令 的 进程 ID: 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1812 949 949 949 ps 














因为 这 种 shell 不 知道 作业 控制 ， 所 以 没有 将 后 台 作 业 放 入 目 己 的 进 
程 组 ， 也 没有 从 后 台 作 业 处 取 走 控制 终端 。 

现在 看 一 看 Bourne shell 如 何 处 理 管道 。 执 行 下 列 命 令 : 

ps -o pid,ppid,pgid,sid,comm | cat1 

FN THY OO AE: 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1823 949 949 949 cat1 
1824 1823 949 949 ps 
《程序 cat1 是 标准 cat 程 序 的 一 个 副本 ， 只 是 名 字 不 同 。 本 节 还 将 使 

用 cat 的 另 一 个 名 为 cat2 的 副本 。 在 一 个 管道 中 使 用 两 个 cat 副 本 时 ， 不 同 
的 名 字 可 使 我 们 将 它们 区 分 开 来 。) 注意 ， 管 道中 的 最 后 一 个 进程 是 
shell 的 子 进程 ， 该 管道 中 的 第 一 个 进程 则 是 最 后 一 个 进程 的 子 进程 。 从 
中 可 以 看 出 ，shell fork 一 个 它 目 号 的 副本 ， 然 后 此 副本 再 为 管道 中 的 每 
条 命令 各 fork 一 个 进程 。 

如 果 在 后 台 执 行 此 管道 : 

ps -0 pid,ppid,pgid,sid,comm | catl & 

则 只 改变 进程 ID。 因 为 shell 并 不 处 理 作 业 控 制 ， 后 台 进 程 的 进程 组 
ID 仍 是 949， 如 同 会 话 的 进程 组 ID 一 样 。 

如 果 一 个 后 台 进 程 试图 读 其 控制 终端 ， 则 会 发 生 什 么 呢 ? PG, A 
执行 : 

cat > temp.foo & 

在 有 作业 控制 时 ， 后 台 作 业 被 放 在 后 台 进 程 组 ， 如 果 后 台 作 业 试 图 
读 控 制 终端 ， 则 会 产生 信号 SIGTTIN。 在 没有 作业 控制 时 ， 其 处 理 方法 
是 : 如 果 该 进程 目 己 没有 重 定 向 标准 输入 ， 则 shell 目 动 将 后 台 进程 的 标 
准 输入 重 定向 到 /dev/null。 读 /dev/null 则 产生 一 个 文件 结束 。 这 就 意味 着 
后 从 cat 进 程 立 即 读 到 文件 尾 ， 并 正常 终止 。 

前 面 说 明了 对 后 人 台 进 程 通过 其 标准 输入 访问 控制 终 问 的 适当 的 处 理 
方法 ， 但 是 ， 如 采 一 个 后 台 进 程 打开 /dewtty 并 且 读 该 控制 终端 ， 又 将 怎 
i ? 对 此 问题 的 回答 是 “看 情况 ”。 但 是 这 很 可 能 不 是 我 们 所 期 望 的 。 
mun: 

crypt < salaries | lpr & 

就 是 这 样 的 一 条 管道 。 我 们 在 后 人 台 运 行 它 ， 但 是 crypt 程序 打 
开 /dev/tty， 更 改 终 端的 特性 (禁止 回 显 ) ， 然 后 从 该 设备 读 ， 最 后 重 置 
该 终端 特 性 。 当 执行 这 条 后 台 管 道 时 ，crypt 在 终端 上 打印 提示 
符 “Password: ”， 但 是 shell 读 取 了 我 们 所 输入 的 加 密 口 令 ， 并 试图 执行 以 
加 和 密 口 令 为 名 称 的 命令 。 我 们 输送 给 shell 的 下 一 行 则 被 crypt 进 程 取 为 口 























令 行 ， 于 是 salaries 也 就 不 能 正确 地 被 译 码 ， 结 果 将 一 堆 无 用 的 信息 送 到 
了 打印 机 。 在 这 里 ， 我 们 有 了 两 个 进程 ， 它 们 试图 同时 读 同 一 设备 ， 其 
结果 则 依赖 于 系统 。 前 面 说 明 的 作业 控制 以 较 好 的 方式 处 理 一 个 终端 在 
多 个 进程 间 的 转 接 。 

返回 到 Bourne _ shell 实例， 在 一 条 管道 中 执行 3 个 进程 ， 我 们 可 以 检 
验 Bourne shell 使 用 的 进程 控制 方式 : 

ps -0 pid,ppid,pgid,sid,comm | cat1 | cat2 

其 输出 为 : 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 

1988 949 949 949 cat2 

1989 1988 949 949 ps 

1990 1988 949 949 catl 

如 果 在 你 的 系统 上 ， 和 输出 的 命令 名 不 正确 ， 那 也 不 必 为 此 感到 惊 
民 。 有 时 可 能 会 得 到 类 似 如 下 的 输出 : 

PID PPID PGID SID COMMAND 
949 947 949 949 sh 

1831 949 949 949 sh 

1832 1831 949 949 ps 

1833 1831 949 949 sh 

造成 此 种 结果 的 原因 是 ，ps 进 程 与 shell 产 生 竞 争 条 件 ，shell 创 建 一 
个 子 进程 并 由 它 执行 cat 命 令 。 在 这 种 情况 下 ， 当 ps 已 经 获得 进程 列表 并 
打印 时 ，shell 尚 未 完成 exec 调 用 。 

再 重申 一 裔 ， 该 管道 中 的 最 后 一 个 进程 是 shell 的 子 进程 ， 而 执行 管 
道中 其 他 命令 的 进程 则 是 该 最 后 进程 的 子 进程 。 图 9-10 显示 了 所 发 生 的 
情况 。 因 为 该 管道 线 中 的 最 后 一 个 进程 是 登录 shell 的 子 进程 ， 当 该 进程 

(cat2) 终止 时 ，shell 得 到 通知 。 

































catl 
(1990) 


图 9-10 Bourne shell 执 行 管 道 ps | catl | cat2 时 的 进程 

现在 让 我 们 用 一 个 运行 在 Linux 上 的 作业 控制 shell 来 检验 同一 个 

例子 。 这 将 显示 这 些 shell 处 理 后 台 作 业 的 方法 。 在 本 例 中 将 使 用 
Bourne-again shell， 用 其 他 作业 控制 shell 得 到 的 结果 几乎 是 一 样 的 。 











ps -0 pid,ppid,pgid,sid,tpgid,comm 
FL oo AY: 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5796 bash 
9796 2837 5796 2837 5796 ps 
(从 本 例 开始 ， 以 粗 体 显 示 前 台 进 程 组 。) 我 们 立即 看 到 了 与 

Bourne shell 例 子 的 区 别 。Bourne-again shell 将 前 台 作 业 (ps) MATE 
自己 的 进程 组 (5796) 。ps 命 令 是 进程 组 组 长 进程 ， 也 是 该 进程 组 的 唯 
一 进程 。 进 一 步 而 言 ， 此 进程 组 具有 控制 终端 ， 所 以 它 是 前 台 进 程 组 。 
我 们 的 登录 shel 在 执行 ps 命令 时 是 后 台 进 程 组 。 但 需要 注意 的 是 ， 这 两 
个 进程 组 2837 和 5796 都 是 同一 会 话 的 成 员 。 事 实 上 ， 在 本 节 的 各 实例 
中 ， 会 话 决 不 会 改变 。 





在 后 台 执 行 此 进程 : 
ps -0 pid,ppid,pgid,sid,tpgid,comm & 
其 输出 为 : 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5797 2837 5797 2837 2837 ps 
再 一 次 ，ps 命 令 被 放 入 它 自 己 的 进程 组 ， 但 是 此 时 进程 组 〈5797 ) 
不 再 是 前 台 进 程 组 ， 而 是 一 个 后 台 进 程 组 。TPGID 2837 指 示 前 台 进 程 组 
是 登录 shell。 
按 下 列 方式 在 一 个 管道 中 执行 两 个 进程 : 
ps -o pid,ppid,pgid,sid,tpgid,comm | cat1 
其 输出 为 : 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5799 bash 
5799 2837 5799 2837 5799 ps 
5800 2837 5799 2837 5799 cat1 
两 个 进程 ps 和 catl 都 在 一 个 新 进程 组 (5799) 中， 这 是 一 个 前 台 进 
程 组 。 在 本 例 和 类 似 的 Bourne shell ”实例 之 间 能 看 到 另 一 个 区 别 。 
Bourne shell 首先 创建 将 执行 管道 中 最 后 一 条 命令 的 进程 ， 而 此 进程 是 
第 一 个 进程 的 父 进程 。 在 这 里 ，Bourne-again ”shell 是 两 个 进程 的 父 进 
程 。 但 是 ， 如 果 在 后 全 执行 此 管道 : 
ps -o pid,ppid,pgid,sid,tpgid,comm | catl & 
其 结果 是 类 似 的 ， 但 是 ps 和 cat1 现 在 都 处 于 同一 后 台 进 程 组 。 
PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5801 2837 5801 2837 2837 ps 
5802 2837 5801 2837 2837 cat1 
注意 ， 使 用 的 shell 不 同 ， 创 建 各 个 进程 的 顺序 也 可 能 不 同 。 








9.10 进程 


我 们 曾 提 及 ， 一 个 其 父 进程 已 终止 的 进程 称 为 孤儿 进程 (orphan 
process) ， 这 种 进程 由 init 进 程 “ 收 养 ”。 现 在 我 们 要 说 明 整 个 进程 组 也 
ee 

实例 

考虑 一 个 进程 ， 它 forkk 了 一 个 子 进程 然后 终止 。 这 在 系统 中 是 经 和 常 
发 生 的 ， 并 无 异常 之 处 ， 但 是 在 父 进程 终止 时 ， 如 果 该 子 进程 停止 (用 
作业 控制 ) 又 将 如 何 呢 ? 子 进程 如 何 继续 ， 以 及 子 进 程 是 否 知道 它 已 经 
是 孤儿 进程 ? 图 9-11 显 示 了 这 种 情形 : 父 进程 已 经 fork 了 子 进 程 ， 该 子 
进程 停止 ， 父 进程 则 将 退出 。 

构成 此 种 情形 的 程序 示 于 图 9-12 中 。 下 面 要 说 明 该 程序 的 某 些 新 特 
性 。 这 里 ， 假 定 使 用 了 一 个 作业 控制 shell。 回 忆 前 面 所 述 ，shell 将 前 
台 进 程 放 在 它 〈 指 前 台 进 程 ) 自己 的 进程 组 中 〈 本 例 中 是 6099) ，shell 
则 留 在 自己 的 进程 组 内 (2837〉。 子 进程 继承 其 父 进程 (6099) 的 进程 
组 。 在 fork 之 后 : 























| 进程 组 2837 





| 进程 组 6099 


图 9-11 将 要 成 为 孤儿 的 进程 组 实例 

。 父 进程 睡眠 5 秒 ， 这 是 一 种 让 子 进程 在 父 进程 终止 之 前 运行 的 一 种 
权宜 之 计 。 

* 子 进程 为 挂 断 信号 (SIGHUP) 建立 信号 处 理 程序 。 这 样 就 能 观察 
到 SIGHUP 信 号 是 否 已 发 送 给 子 进程 。 (第 10 章 将 讨论 信号 处 理 程 


序 。) 

“ 子 进 程 用 kil 函 数 向 其 自身 发 送 停止 信号 〈SIGTSTP) 。 这 将 停止 
子 进程 ， 类 似 于 用 终端 挂 起 字符 〈Ctrl+Z) 停止 一 个 前 人 台 作 业 。 

“ 当 父 进程 终止 时 ， 该 子 进程 成 为 孤儿 进程 ， 所 以 其 父 进程 ID 成 为 
1， 也 就 是 init 进 程 ID。 

"现在 ， 子 进程 成 为 一 个 孤儿 进程 组 的 成 员 。POSIX.1 将 孤儿 进程 组 
(orphaned process group) 定义 为 : 该 组 中 每 个 成 员 的 父 进 程 要 么 是 该 
组 的 一 个 成 员 ， 要 么 不 是 该 组 所 属 会 话 的 成 员 。 对 孤儿 进程 组 的 另 一 种 
描述 可 以 是 : 一 个 进程 组 不 是 孤儿 进程 组 的 条 件 是 一 一 该 组 中 有 一 个 进 
程 ， 其 父 进程 在 属于 同一 会 话 的 另 一 个 组 中 。 如 果 进 程 组 不 是 孤儿 进程 
组 ， 那 么 在 属于 同一 会 话 的 另 一 个 组 中 的 父 进程 就 有 机 会 重新 启动 该 组 
中 停止 的 进程 。 在 这 里 ， 进 程 组 中 每 一 个 进程 的 父 进程 〈 例 如， 进程 























6100 的 父 进程 是 进程 1) 都 属于 另 一 个 会 话 。 所 以 此 进程 组 是 孤儿 进程 
组 。 

“因为 在 父 进程 终止 后 ， 进 程 组 包含 一 个 停止 的 进程 ， 进 程 组 成 为 
孤儿 进程 组 ，POSIX.1 要 求 同 新 孤儿 进程 组 中 人 处 于 停止 状态 的 每 一 个 进 
程 发 送 挂 断 信 号 (SIGHUP) ， 接 着 又 向 其 发 送 继续 信和 号 
(SIGCONT) 。 

在 处 理 了 挂 断 信号 后 ， 子 进程 继续 。 对 挂 断 信 号 的 系统 默认 动作 
是 终止 该 进程 ， 为 此 必须 提供 一 个 信号 处 理 程序 以 捕捉 该 信号 。 因 此 ， 
我 们 期 望 sig_hup 函 数 中 的 printf 会 在 pr_ ids 函 数 中 的 printf 之 前 执行 。 





#include "apue.h" 
#include <errno.h> 


static void 
sig_hup(int signo) 
{ 
printf ("SIGHUP received, pid = $ld\n", (long)getpid()); 


static void 
pr_ids(char *name) 
{ 
printf("%s: pid = %ld, ppid = ld, pgrp = %ld, tpgrp = %ld\n", 
name, (long)getpid(), (long) getppid(), (long)getpgrp(), 
(long) tcgetpgrp (STDIN_FILENO) ) ; 


fflush (stdout) ; 
} 
int 
main (void) 
{ 
char Ct 
pidt pid; 


pr_ids ("parent"); 
if ((pid = fork()) < 0) { 
err sys("fork error"); 
} else if (pid > 0) { /* parent */ 
sleep (5); /* sleep to let child stop itself */ 
} else { /* child */ 
pE rds ("child"); 
signal (SIGHUP, sig_hup); /* establish signal handler */ 
kill(getpid(), SIGTSTP); /* stop ourself */ 
pr_ids("child"); /* prints only if we're continued */ 
if (read(STDIN FILENO, &c, 1) != 1) 


printf ("read error %d on controlling TTY\n", errno); 


| 
exit(0); 




















图 9-12 创建 一 个 孤儿 进程 组 
下 面 是 图 9-12 中 的 程序 的 输出 : 
$ ./a.out 
parent: pid = 6099, ppid = 2837, pgrp = 6099, tpgrp = 6099 
child: pid = 6100, ppid = 6099, pgrp = 6099, tpgrp = 6099 
$ SIGHUP received, pid = 6100 
child: pid = 6100, ppid = 1, pgrp = 6099, tpgrp = 2837 
read error 5 on controlling TTY 
注意 ， 因 为 两 个 进程 ， 登 录 shell 和 子 进 程 都 写 回 终端 ， 所 以 shell 提 
示 符 和 子 进程 的 输出 一 起 出 现 。 正 如 我 们 所 期 望 的 那样 ， 子 进程 的 父 进 
程 ID 变 成 1。 
在 子 进 程 中 调用 pr_ids 后 ， 程 序 企 图 读 标准 输入 。 如 前 所 述 ， 当 后 
台 进 程 组 试图 读 控制 终端 时 ， 对 该 后 台 进 程 组 产生 SIGTTIN。 但 在 这 
里 ， 这 是 一 个 孤儿 进程 组 ， 如 果 内 核 用 此 信号 停止 它 ， 则 此 进程 组 中 的 
进程 就 再 也 不 会 继续 。POSIX.1 规 定 ，read 返 回 出 错 ， 其 errno 设 置 为 EIO 
(在 本 书 所 用 的 系统 中 其 值 是 5〉。 
最 后 ， 要 注意 的 是 父 进程 终止 时 ， 子 进程 变 成 后 台 进 程 组 ， 因 为 父 
进程 是 由 shell 作 为 前 台 作 业 执 行 的 。 
在 19.5 节 的 pty 程 序 中 将 会 看 到 孤儿 进程 组 的 另 一 个 例子 。 





9.11 FreeBSD 实 现 


前 面 说 明了 进程 、 进 程 组 、 会 话 和 控制 终端 的 各 种 属性 ， 值 得 观察 
一 下 所 有 这 些 是 如 何 实现 的 。 下 面 简要 说 明 FreeBSD 中 的 实现 。SVR4 实 
现 的 某 些 详细 情况 则 请 参阅 williams[1989]。 图 9-13 显 示 了 FreeBSD 使 用 
的 各 种 有 关 数 据 结 构 。 

下 面 从 session 结 构 开始 说 明 图 中 标 出 的 各 个 字段 。 每 个 会 话 都 分 配 
一 个 Session 结构 〈 例 如 ， 每 次 调用 setsid 时 ) 。 

。$_count 是 该 会 话 中 的 进程 组 数 。 当 此 计数 器 减 至 0 时 ， 则 可 释放 此 
结构 。 

“s_leader 是 指 同 会 话 首 进程 proc 结 构 的 指针 。 

“s_ttyvp 是 指 同 控制 终端 wnode 结 构 的 指针 。 

“s_ttyp 是 指 辣 控制 终端 tty 结 构 的 指针 。 

“s_sid 是 会 话 ID。 请 记 住 会 话 ID 这 一 概念 并 非 Single UNIX 
Specification 的 组 成 部 分 。 

在 调用 setsid 时 ， 在 内 核 中 分 配 一 个 新 的 session 结 构 。s_count 设 置 
为 1，s_leader 设 置 为 调用 进程 proc 结构 的 指针 ，s_sid 设置 为 进程 ID, 
为 新 会 话 没有 控制 终端 ， 所 以 s_ttyvp 和 s_ttyp 设 置 为 空 指 针 。 

接着 说 明 tty 结构 。 每 个 终端 设备 和 每 个 伪 终 问 设 备 均 在 内 核 中 分 
配 这 样 一 种 结构 (第 19 章 将 对 伪 终 端 做 更 多 说 明 ) 。 

“L_session 指 回 将 此 终端 作为 控制 终端 的 Session 结构 〈 注 意 ，tty 结 构 
指 同 session 结 构 ，session 结 构 也 指 同 tty 结 构 ) 。 终 端 在 失去 载波 信号 时 
使 用 此 指针 将 挂 起 信号 发 送 给 会 话 首 进 程 〈 见 图 9-7) 。 
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图 9-13 会 话 和 进程 组 的 FreeBSD 实 现 

“tpgrp 指 回 前 台 进 程 组 的 pgrp 结 构 。 终 端 驱动 程序 用 此 字段 将 信和 号 
发 送 给 前 台 进 程 组 。 由 输入 特殊 字符 《中断 、 退 出 和 挂 起 ) 而 产生 的 3 
个 信号 被 发 送 至 前 台 进 程 组 。 

t_termios 是 包含 所 有 这 些 特殊 字符 和 与 该 终端 有 关 信 息 〈( 如 波 特 
率 、 回 显 打 开 或 关闭 等 ) 的 结构 。 第 18 章 将 再 说 明 此 结构 。 
t winsize 是 包含 终端 窗口 当前 大 小 的 winsize 型 结构 。 当 终端 窗口 

大 小 改变 时 ， 信 和 号 SIGWINCH 被 发 送 至 前 台 进 程 组 。18.12 节 将 说 明 如 
何 设置 和 获取 终端 当前 窗口 大 小 。 

为 了 找到 特定 会 话 的 前 台 进 程 组 ， 内 核 从 session 结 构 开 始 ， 然 后 用 
s_ttyp 得 到 控制 终端 的 tty 结 构 ， 再 用 t_pgrp 得 到 前 台 进 程 组 的 pgrp 结 构 。 

pgrp 结 构 包 含 一 个 特定 进程 组 的 信息 。 其 中 各 相关 字段 具体 如 下 。 

“pg_id 是 进程 组 ID。 

epg_session 指 同 此 进程 组 所 属 会 话 的 session 结 构 。 

。pg_members 是 指向 此 进程 组 proc 结构 表 的 指针 ， 该 proc 结构 代 
表 进 程 组 的 成 员 。proc 结 构 中 p_pglist 结 构 是 双向 链表 ， 指 向 该 组 中 的 下 
一 个 进程 和 和 上 一 个 进程 。 直 到 过 到 进程 组 中 的 最 后 一 个 进程 ， 它 的 proc 
结构 中 p_pglist 结 构 为 空 指针 。 

proc 结 构 包 含 一 个 进程 的 所 有 信息 。 

。p_pid 包 含 进程 ID。 

*p_pptr 是 指 癌 父 进 程 proc 结 构 的 指针 。 

“p_pgrp 指 同 本 进程 所 属 的 进程 组 的 pgrp 结 构 的 指针 。 

*p_pglist 是 一 个 结构 ， 其 中 包含 两 个 指针 ， 分 别 指 辣 进程 组 中 上 一 
ASB SER 

最 后 还 有 一 个 vnode 绪 构 。 如 前 所 述 ， 在 打开 控制 终端 设备 时 分 配 
此 结构 。 进 程 对 /dev/tty 的 所 有 访问 都 通过 vnode 结 构 。 








9.12 小 结 


本 章 说 明了 进程 组 之 间 的 关系 一 一 会 话 ， 它 由 若干 个 进程 组 组 成 。 
作业 控制 是 当今 很 多 UNIX 系 统 所 支持 的 功能 ， 本 章 说 明了 它 是 如 何 由 
支持 作业 控制 的 shell 实 现 的 。 在 这 些 进 程 关 系 中 也 涉及 了 进程 的 控制 终 
端 /dew/tty。 

所 有 这 些 进程 的 关系 都 使 用 了 很 多 信号 方面 的 功能 。 下 一 章 将 详细 
讨论 UNIX 中 的 信号 机 制 |。 





习题 


9.1 考虑 6.8 节 中 说 明 的 utmp 和 wtmp 文 件 ， 为 什么 logout 记 录 是 由 init 
进程 写 的 ?对 于 网 络 登 录 的 处 理 与 此 相同 吗 ? 

9.2 编写 一 段 程序 调用 fork 并 使 子 进程 建立 一 个 新 的 会 话 。 验 证 子 进 
程 变 成 了 进程 组 组 长 且 不 再 有 控制 终端 。 





第 10 音 E = 


10.1 引言 


言 号 是 软件 中 断 。 很 多 比较 重要 的 应 用 程序 都 需 处 理 信 号 。 信 和 号 提 
供 了 一 种 处 理 异 步 事 件 的 方法 ， 例 如 ， 终 端 用 户 键 入 中 断 键 ， 会 通过 信 
号 机 制 停止 一 个 程序 ， 或 及 早 终止 管道 中 的 下 一 个 程序 。 

UNIX 系 统 的 早期 版 本 就 已 经 提供 信号 机 制 ， 但 是 这 些 系 统 〈 如 
V7) 所 提供 的 信号 模型 并 不 可 靠 。 信 号 可 能 丢失 ， 而 且 在 执行 临界 区 
代码 时 ， 进 程 很 难关 闭 所 选择 的 信号 。4.3BSD 和 SVR3 对 信和 号 模型 都 做 
了 更 改 ， 增 加 了 可 靠 信 号 机 制 。 但 是 Berkeley 和 AT&T 所 做 的 更 改 之 间 
并 不 兼容 。 笠 运 的 是 ，POSIX.1 对 可 靠 信 号 例 程 进行 了 标准 化 ， 这 正 是 
本 章 所 要 说 明 的 。 

本 章 先 对 信号 机 制 进行 综述 ， 并 说 明 每 种 信号 的 一 般 用 法 。 然 后 分 
析 早 期 实现 的 问题 。 在 分 析 存 在 的 问题 之 后 再 说 明 解 决 这 些 问题 的 方 
法 ， 这 种 安排 有 助 于 加 深 对 改进 机 制 的 理解 。 本 章 也 包含 了 很 多 并 非 完 
全 正确 的 实例 ， 这 样 做 的 目的 是 为 了 对 其 不 足 之 处 进行 讨论 。 














10.2 信 吕 概念 


首先 ， 每 个 信号 都 有 一 个 名 字 。 这 些 名 字 都 以 3 个 字符 SIG 开 头 。 例 

如 ，SIGABRT 是 天 折 信 号 ， 当 进程 调用 abort 函 数 时 产生 这 种 信和 号。 
SIGALRM 是 闹钟 信号 ， 由 alarm 函 数 设置 的 定时 器 超时 后 将 产生 此 信 
号 。V7 有 15 种 不 同 的 信号 ，SVR4 和 4.4BSD HA 31 种 不 同 的 信和 号。 
FreeBSD 8.0 支 持 32 种 信号 ，Mac OS X 10.6.8 以 及 Linux 3.2.0 都 支持 31 种 
信号 ， 而 Solaris 10 支 持 40 种 信号 。 但 是 ，FreeBSD、Linux 和 Solaris 作 为 
实时 扩展 都 支持 另外 的 应 用 程序 定义 的 信号 。 虽 然 本 书 不 包括 POSIX 实 
时 扩展 (有关 信息 请 参阅 Gallmeister[1995]) ， 但 是 SUSv4 已 经 把 实时 信 
号 接口 移 至 基础 规范 说 明 中 。 

在 头 文件 <signal.h> 中 ， 信 号 名 都 被 定义 为 正 整 数 常 量 〈 信 号 编 
) 


实际 上 上， 实现 将 各 信号 定义 在 另 一 个 头 文件 中 ， 但 是 该 头 文 件 又 包 
括 在 <signal.h> 中 。 内 核 包 括 对 用 户 级 应 用 程序 有 意义 的 头 文 件 ， 这 被 
认为 是 一 种 不 好 的 形式 ， 所 以 如 知 应 用 程序 和 内 核 两 者 都 需 使 用 同一 冠 
义 ， 那 么 束 将 有 关 信 息 放 置 在 内 核 尖 文件 中 ， 然 后 用 户 级 涉 文 件 再 包括 
该 内 核 头 文件 。 于 是 ，FreeBSD 8.0 和 Mac OS X 10.6.8 将 信号 定义 在 
<sys/signal.h> 中 ，Linux 3.2.0 将 信号 定义 在 <bits/signum.h> 中 ，Solaris 10 
将 信号 定义 在 <sys/iso/signal_iso.h> 中 。 

不 存在 编号 为 0 的 信号 。 在 10.9 节 中 将 会 看 到 ，kill 函数 对 信号 编 
号 0 有 特殊 的 应 用 。POSIX.1 将 此 种 信号 编号 值 称 为 空 信号。 

很 多 条 件 可 以 产生 信和 号 。 

“ 当 用 户 按 某 些 终端 键 时 ， 引 发 终端 产生 的 信号 。 在 终端 上 按 
Delete 键 〈 或 者 很 多 系统 中 的 Ctrl+C 键 〗》 通 常 产 生 中 断 信 和 号 
(SIGINT) 。 这 是 停止 一 个 已 失去 控制 程序 的 方法 。《〈 第 18 章 将 说 明 
此 信号 可 被 映射 为 终端 上 的 任 一 字符 。) 

“ 便 件 异常 产生 信和 号: 除数 为 0(、 无 效 的 内 存 引 用 等 。 这 些 条 件 通 党 
由 硬件 检测 到 ， 并 通知 内 核 。 然 后 内 核 为 该 条 件 发 生 时 正在 运行 的 进程 
产生 适当 的 信号 。 例 如 ， 对 执行 一 个 无 效 内 存 引 用 的 进程 产生 
SIGSEGV 信 号。 

“进程 调用 kill(2) 函 数 可 将 任意 信号 发 送 给 另 一 个 进程 或 进程 组 。 自 
然 ， 对 此 有 所 限制 : 接收 信号 进程 和 发 送信 号 进程 的 所 有 者 必须 相同 ， 
或 发 送信 号 进程 的 所 有 者 必须 是 超级 用 户 。 
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。 用 户 可 用 kill(1) 命 令 将 信号 发 送 给 其 他 进程 。 此 命令 只 是 k 记 函数 的 
接口 。 常 用 此 命令 终止 一 个 失控 的 后 台 进 程 。 

* 当 检测 到 某 种 软件 条 件 已 经 发 生 ， 并 应 将 其 通知 有 关 进 程 时 也 产 
生 信 和 号。 这 里 指 的 不 是 硬件 产生 条 件 〈 如 除 以 0) ， 而 是 软件 条 件 。 例 
如 SIGURG 〈 在 网 络 连 接 上 传 来 带 外 的 数据 ) 、SIGPIPE (在 管道 的 读 
进程 已 终止 后 ， 一 个 进程 写 此 管道 ) 以 及 SIGALRM (进程 所 设置 的 定 
时 器 已 经 超时 ) 。 

信号 是 异步 事件 的 经 典 实例 。 产 生 信 号 的 事件 对 进程 而 言 是 随机 出 
现 的 。 进 程 不 能 简单 地 测试 一 个 变量 (如 errmmo〉 来 判断 是 否 发 生 了 一 个 
信号 ， 而 是 必须 告诉 内 核 “ 在 此 信号 发 生 时 ， 请 执行 下 列 操 作 ”。 

在 某 个 信号 出 现时 ， 可 以 告诉 内 核 按 下 列 3 种 方式 之 一 进行 处 理 ， 
我 们 称 之 为 信号 的 处 理 或 与 信号 相关 的 动作 。 

(1) 忽略 此 信号 。 大 多 数 信和 号 都 可 使 用 这 种 方式 进行 处 理 ， 但 有 
两 种 信号 却 决 不 能 被 忽略 。 它 们 是 SIGKILL 和 SIGSTOP。 这 两 种 信号 不 
能 被 忽略 的 原因 是 : 它们 向 内 核 和 超级 用 户 提 供 了 使 进程 终止 或 停止 的 
可 靠 方法 。 另 外 ， 如 果 忽 略 某 些 由 硬件 异常 产生 的 信号 〈 如 非法 内 存 引 
用 或 除 以 0) ， 则 进程 的 运行 行为 是 未 定义 的 。 

(2) 捕捉 信号 。 为 了 做 到 这 一 点 ， 要 通知 内 核 在 某 种 信号 发 生 
时 ， 调 用 一 个 用 户 函 数 。 在 用 户 函 数 中 ， 可 执行 用 户 和 希望 对 这 种 事件 进 
行 的 处 理 。 例 如 ， 若 正在 编写 一 个 命令 解释 器 ， 它 将 用 户 的 输入 解释 为 
命令 并 执行 之 ， 当 用 户 用 键盘 产生 中 断 信号 时 ， 很 可 能 希望 该 命令 解释 
器 返回 到 主 循环 ， 终 止 正 在 为 该 用 户 执行 的 命令 。 如 果 捕 捉 到 
SIGCHLD 信号 ， 则 表示 一 个 子 进程 已 经 终止 ， 所 以 此 信号 的 捕捉 函数 
可 以 调用 waitpid 以 取得 该 子 进程 的 进程 ID 以 及 它 的 终止 状态 。 又 例如 ， 
如 果 进 程 创建 了 临时 文件 ， 那 么 可 能 要 为 SIGTERM 信号 编写 一 个 信和 号 
捕捉 函数 以 清除 临时 文件 (SIGTERM 是 终止 信号 ，kill 命令 传送 的 系 
统 默认 信号 是 终止 信号 ) 。 注 意 ， 不 能 捕捉 SIGKILL 和 SIGSTOP 信 和 号 。 

(3) 执行 系统 默认 动作 。 图 10-1 给 出 了 对 每 一 种 信号 的 系统 默认 
动作 。 注 意 ， 对 大 多 数 信 号 的 系统 默认 动作 是 终止 该 进程 。 

图 10-1 列 出 了 所 有 信号 的 名 字 ， 说 明了 哪些 系统 支持 此 信号 以 及 对 
于 这 些 信号 的 系统 默认 动作 。 在 SUS BIH, “oP ARIAS EAE 
本 POSIX.1 规范 部 分 ,“XST” 表 示 该 信号 定义 在 XSI 扩 展 部 分 。 

在 系统 默认 动作 列 , “终止 +fcore” 表 示 在 进程 当前 工作 目录 的 core 文 
件 中 复制 了 该 进程 的 内 存 映像 〈 该 文件 名 为 core， 由 此 可 以 看 出 这 种 功 
能 很 久之 前 就 是 UNIX 的 一 部 分 ) 。 大 多 数 UNIX 系 统 调试 程序 都 使 用 
core 文 件 检查 进程 终止 时 的 状态 。 



































Linux MacOS Solaris 


SIGABRT 异常 终止 (abort) 
SIGALRM 定时 器 超时 (alarm) 
SIGBUS 硬件 故障 

SIGCANCEL | 线程 库 内 部 使 用 

SIGCHLD 子 进 程 状态 改变 

SIGCONT 使 暂停 进程 继续 

SIGEMT 硬件 故障 

SIGFPE 算术 异常 

SIGFREEZE | 检查 点 冻结 

SIGHUP 连接 断 开 

SIGILL 非法 硬件 指令 

SIGINFO 键盘 状态 请 求 

SIGINT 终端 中 斯 符 

SIGIO FRA VO 

SIGIOT 硬件 故障 

SIGJVM1 Java 虚拟 机 内 部 使 用 
SIGJVM2 Java 虚拟 机 内 部 使 用 
SIGKILL 终止 

SIGLOST 资源 丢失 

SIGLWP 线程 库 内 部 使 用 

SIGPIPE 写 至 无 读 进程 的 管道 
SIGPOLL 可 轮 询 事件 (poll) 
SIGPROF 梗概 时 间 超 时 (setitimer) 
SIGPWR 电源 失效 /重启 动 

SIGQUIT 

SIGSEGV 

SIGSTKFLT 

SIGSTOP 

SIGSYS 

SIGTERM 

SIGTHAW ao PE 

SIGTHR 线程 库 内 部 使 用 

SIGTRAP 硬件 故障 

SIGTSTP 终端 停止 符 

SIGTTIN 后 台 读 控制 tty 

SIGTTOU 后 台 写 向 控制 tty 

SIGURG 紧急 情况 〈 套 接 字 ) 
SIGUSR1 用 户 定义 信号 

SIGUSR2 用 户 定 义 信号 

SIGVTALRM | 虚拟 时 间 闸 钟 (setitimer) 
SIGWAITING | 线程 库 内 部 使 用 

SIGWINCH “| 终端 窗口 大 小 改变 

SIGXCPU 超过 CPU 限制 (setrlimit) 
SIGXFSZ 超过 文件 长 度 限 制 (setrlimit) 终 让 或 终 上 上 Hoomg 
SIGXRES “| 超过 资源 控制 忽略 





图 10-1 UNIX 系 统 信和 号 

产生 core 文 件 是 大 多 数 UNIX 系 统 的 实现 功能 。 虽 然 该 功能 不 是 
POSIX.1 的 组 成 部 分 ， 但 在 Single UNIX Specification XSI 的 扩展 部 分 
中 ， 这 一 功能 作为 一 个 潜在 的 特定 实现 的 动作 被 提 及 。 

在 不 同 的 实现 中 ，core 文件 的 名 字 可 能 不 同 。 例 如 ， 在 “FreeBSD 
8.0 F, core 文件 名 为 cmdname.core， 其 中 cmdname 是 接收 到 信号 的 进 
程 所 执行 的 命令 名 。 在 Mac OS X 10.6.8 中 ，core 文 件 名 是 core.pid， 其 
中 ，pid 是 接收 到 信号 的 进程 的 D。 (这 些 系统 允许 经 sysctl 参 数 配 置 
core 文 件 名 。 在 Linux 3.2.0 中 ，core 文 件 名 通 
过 /proc/sys/kernel/core_pattern 进 行 配 置 。) 

大 多 数 实现 在 相应 进程 的 工作 目录 中 包含 core 文 件 项 ; 但 Mac OS X 
将 所 有 core 文 件 都 放置 在 /cores 目 录 中 。 

在 下 列 条 件 下 不 产生 core 文 件 : (a) 进程 是 设置 用 户 ID 的 ， 而 且 
当前 用 户 并 非 程 序 文件 的 所 有 者 ; O) 进程 是 设置 组 ID 的 ， 而 且 当 前 
用 户 并 非 访 程序 文件 的 组 所 有 者 ; oO 用 户 没 有 写 当 前 工作 目录 的 权 
R; dO 文件 已 存在 ， 而 且 用 户 对 该 文件 设 有 写 权 限 ; Ce) 文件 太 大 
《回忆 7.11 节 中 的 RLIMIT_CORE 限 制 ) 。core 文 件 的 权限 (假定 该 文件 
在 此 之 前 并 不 存在 ) 通常 是 用 户 读 / 写 ， 但 Mac OS X 只 设置 为 用 户 读 。 

在 图 10-1 说 明 中 的 “人 硬件 故障 ”对 应 于 实现 定义 的 硬件 故障 。 这 些 名 
字 中 有 很 多 取 自 UNIX 系 统 早先 在 PDP-11 上 的 实现 。 请 查看 你 所 使 用 系 
统 的 手册 ， 以 确切 地 弄 清 楚 这 些 信号 对 应 于 哪些 错误 类 型 。 

下 面 较 详 细 地 逐一 说 明 这 些 信号 。 

SIGABRT 调用 abort 函 数 时 〈 见 10.17 节 ) 产生 此 信和 号。 进程 异常 终 
TEs 

SIGALRM 当 用 alarm 函 数 设置 的 定时 器 超时 时 ， 产 生 此 信号。 详细 
hb al 。 若 由 setitimer(2) 函 数 设 置 的 间隔 时 间 已 经 超时 时 ， 也 产 

Wis Ss 

SIGBUS 指示 一 个 实现 定义 的 人 硬件 故障 。 当 出 现 某 些 类 型 的 内 存 故 
障 时 《〈 如 14.8 节 中 说 明 的 ) ， 实 现 常 第 产生 此 种 信号 。 
n SIGCANCEL 这 是 Solaris 线 程 库 内 部 使 用 的 信号 。 它 不 适用 于 一 般 
WW FA 

SIGCHLD 在 一 个 进程 终止 或 停止 时 ，SIGCHLD 信 和 号 被 送 给 其 父 进 
程 。 按 系统 默认 ， 将 忽略 此 信号 。 如 果 父 进程 希望 被 告知 其 子 进程 的 这 
种 状态 改变 ， 则 应 捕捉 此 信号 。 信 号 捕捉 函数 中 通常 要 调用 一 种 wait 也 
数 以 取得 子 进程 ID 和 其 终止 状态 。System V 的 早期 版 本 有 一 个 名 为 
SIGCLD (StH) 的 类 似 信号 。 这 一 信号 具有 与 其 他 信和 号 不 同 的 语义 ， 
SVR2 的 手册 页 警告 在 新 的 程序 中 尽量 不 要 使 用 这 种 信号 。 SATA 



























































的 是 ， 在 SVR3 和 SVR4 版 的 手册 页 中 ， 该 警告 消失 了 。) 应 用 程序 应 当 
使 用 标准 的 SIGCHLD 信 号 ， 但 应 了 解 ， 为 了 癌 后 兼容 ， 很 多 系统 定义 
了 与 SIGCHLD 等 同 的 SIGCLD。 如 果 有 使 用 SIGCLD 的 软件 ， 需 要 查阅 
系统 手册 ， 了 解 它 具体 的 语义 。10.7 节 将 讨论 这 两 个 信和 号。 

SIGCONT 此 作业 控制 信号 发 送 给 需要 继续 运行 ， 但 当前 处 于 停止 
状态 的 进程 。 如 果 接 收 到 此 信号 的 进程 处 于 停止 状态 ， 则 系统 默认 动作 
是 使 该 进程 继续 运行 ;否则 默认 动作 是 忽略 此 信号 。 人 例如， 全屏 编辑 程 
序 在 捕捉 到 此 信号 后 ， 使 用 信号 处 理 程 序 发 出 重新 绘制 终端 屏幕 的 通 
知 。 关 于 进一步 的 情况 见 10.21 节 。 

SIGEMT 指示 一 个 实现 定义 的 人 硬件 故障 。 

EMT 这 一 名 字 来 自 PDP-11 的 仿真 器 陷入 (emulator trap) 指令。 并 
非 所 有 平台 都 支持 此 信号 。 例 如 ，Linux 只 对 SPARC、MIPS 和 PA_RISC 
等 系统 结构 支持 SIGEMT。 

SIGFPE 此 信号 表示 一 个 算术 运算 异常 ， 如 除 以 0、 浮 点 洲 出 等 。 

SIGFREEZE 此 信号 仅 由 Solaris 定 义 。 它 用 于 通知 进程 在 冻结 系统 
状态 之 前 需要 采取 特定 动作 ， 例 如 当 系 统 进 入 休眠 或 挂 起 状态 时 可 能 需 
要 做 这 种 处 理 。 

SIGHUP 如 果 终 端 接口 检测 到 一 个 连接 断 开 ， 则 将 此 信号 送 给 与 该 
终端 相关 的 控制 进程 〈 会 话 首 进 程 ) 。 见 图 9-13， 此 信和 号 被 送 给 session 
结构 中 $S_leader 字 段 所 指向 的 进程 。 仅 当 终 端的 CLOCAL 标 志 没 有 设置 
时 ， 在 上 述 条 件 下 才 产 生 此 信号 。 (如 果 所 连接 的 终端 是 本 地 的 ， 则 设 
置 该 终端 的 CLOCAL 标 志 。 它 告诉 终端 驱动 程序 忽略 所 有 调制 解 调 器 的 
状态 行 。 第 18 章 将 说 明 如 何 设置 此 标志 。 ) 

SIGILL 此 信和 号 表示 进程 已 执行 一 条 非法 硬件 指令 。 

SIGINFO 这 是 一 种 BSD 信 号 ， 当 用 户 按 状态 键 〈 一 般 采 用 Ctrl+T) 
时 ， 终 端 驱 动 程序 产生 此 信号 并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 ( 见 
图 9-9) 。 此 信和 号 通常 造成 在 终端 上 显示 前 台 进 程 组 中 各 进程 的 状态 信 


注意 ， 接 到 此 信号 的 会 话 首 进程 可 能 在 后 台 ， 作 为 一 个 例子 ， 请 参 
见 图 9-7。 这 区 别 于 由 终端 正常 产生 的 几 个 信号 (中 断 、 退 出 和 挂 
起 ) ， 这 些 信号 总 是 传递 给 前 台 进 程 组 。 

如 果 会 话 首 进 程 终止 ， 也 产生 此 信号 。 在 这 种 情况 ， 此 信号 送 给 前 
台 进 程 组 中 的 每 一 个 进程 。 

通常 用 此 信号 通知 守护 进程 〈 见 第 13 章 ) 再 次 读 取 它们 的 配置 文 
件 。 选 用 SIGHUP 的 理由 是 ， 守 护 进 程 不 会 有 控制 终端 ， 通 常 决 不 会 接 
收 到 这 种 信号 。 

4.3BSD 的 abort 函 数 产 生 此 信号 。 现 在 该 函数 产生 SIGABRT 信 号。 









































虽然 Alpha 平 台 将 SIGINFO 定 义 为 与 IGPWR 具 有 相同 值 ， 但 是 
Linux 并 不 支持 SIGINFO 信 号 。 这 更 多 是 因为 需要 对 OSF/1 开 发 的 软件 所 
供 某 种 程度 的 兼容 。 

SIGINT 当 用 户 按 中 断 键 〈 一 般 采 用 Delete 或 Ctrl+C) 时， 终端 驱 
动 程序 产生 此 信号 并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 〈 见 图 9-9) 。 

当 一 个 进程 在 运行 时 失控 ， 特 别 是 它 正 在 屏幕 上 产生 大 量 不 需要 的 输出 
时 ， 常 用 此 信号 终止 它 。 
SIGIO ”此 信和 号 指示 一 个 异步 1O 事 件 。 在 14.5.2 节 中 将 对 此 进行 讨 


在 图 10-1 中 ， 对 SIGIO 的 系统 默认 动作 是 终止 或 忽略 。 遗 憾 的 是 ， 
这 依赖 于 系统 。 在 System V 中 ，SIGIO 与 SIGPOLL 相 同 ， 其 默认 动作 是 
终止 此 进程 。 在 BSD 中 ， 其 默认 动作 是 忽略 此 信号。 

Linux 3.2.0 和 Solaris 10 将 SIGIO 定 义 为 与 IGPOLL 具 有 相同 值 ， 所 
以 默认 行为 是 终止 该 进程 。 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 默 认 
行为 是 忽略 该 信号 。 

SIGIOT 这 指示 一 个 实现 定义 的 硬件 故障 。 

IOT 这 个 名 字 来 自 于 PDP-11， 它 是 PDP-11 计 算 机 “输入 /输出 
TRAP” (input/output TRAP) 指令 的 缩写 。System V 的 早期 版 本 ， 由 
abort 函 数 产 生 此 信和 号。 该 函数 现在 产生 SIGABRT 信 号。 

FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 将 SIGIOT 定 
义 为 与 SIGABRT 具 相同 值 。 

SIGJVM1 Solaris 上 为 Java 虚 拟 机 预 留 的 一 个 信号 。 

SIGJVM2 Solaris 上 为 Java 虚 拟 机 预 留 的 另 一 个 信号 。 

SIGKILL 这 是 两 个 不 能 被 捕捉 或 忽略 信号 中 的 一 个 。 它 向 系统 管理 
员 提 供 了 一 种 可 以 杀 死 任 一 进程 的 可 靠 方 法 。 

SIGLOST 运行 在 Solaris NEFSv4 客 户 端 系统 中 的 进程 ， 恢 复 阶 段 不 
能 重新 获得 锁 ， 此 时 将 由 这 个 信号 通知 该 进程 。 

SIGLWP ”此 信号 由 Solaris 线 程 库 内 部 使 用 ， 并 不 做 一 般 使 用 。 在 
FreeBSD 中 ，SIGLWP 是 SIGTHR 的 别名 。 

SIGPIPE ”如 果 在 管道 的 读 进程 已 终止 时 写 管 道 ， 则 产生 此 信号 。 
15.2 节 将 说 明 管 道 。 当 类 型 为 SOCK_STREAM 的 套 接 字 已 不 再 连接 
时 ， 进 程 写 该 套 接 字 也 产生 此 信号 。 我 们 将 在 第 16 章 说 明 套 接 字 。 

SIGPOLL 这 个 信号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 会 
将 此 信号 移 除 。 当 在 一 个 可 轮 询 设备 上 发 生 一 个 特定 事件 时 产生 此 信 
写 。14.4.2 节 将 说 明 poll 函 数 和 此 信号 ， 它 起 源 于 SVR3， 与 BSD 的 SIGIO 
和 SIGURG 信 号 接近 。 在 Linux 和 Solaris 中 ，SIGPOLL 定 义 为 与 IGIO 具 
有 相同 值 。 
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SIGPROF 这 个 信号 在 SUSv4 中 己 被 标记 为 弃 用 ， 将 来 的 标准 可 能 会 
将 此 信号 移 除 。 当 setitimer(2) 函 数 设置 的 梗概 统计 间隔 定时 器 (profiling 
interval timer) 已 经 超时 时 产生 此 信号。 

SIGPWR 这 是 一 种 依赖 于 系统 的 信号 。 它 主要 用 于 具有 不 间断 电源 
(UPS) 的 系统 。 如 果 电 源 失 效 ， 则 UPS 起 作用 ， 而 且 通 常 软件 会 接 到 
通知 。 在 这 种 情况 下 ， 系 统 依靠 蓄电池 电源 继续 运行 ， 所 以 无 须 做 任何 
处 理 。 但 是 如 果 蓄 电池 也 将 不 能 支持 工作 ， 则 软件 通常 会 再 次 接 到 通 
知 ， 此 时 ， 系 统 必 项 使 其 各 部 分 都 停止 运行 。 这 时 应 当 发 送 SIGPWR 
言 号 。 在 大 多 数 系 统 中 ， 接 到 蓄电池 电压 过 低 信 息 的 进程 将 信和 号 
SIGPWR 发 送 给 init 进 程 ， 然 后 由 init 处 理 停机 操作 。 

Solaris 10 和 有 些 Linux 版 本 在 inittab 文 件 中 有 两 个 记录 项 用 于 此 种 月 
HJ: powerfail 以 及 powerwait (或 powerokwait) 。 

在 图 10-1 中 ， 我 们 将 SIGPWR 的 默认 动作 标记 为 “终止 或 忽略 ”"。 遗 
憾 的 是 ， 这 种 默认 动作 依赖 于 系统 。Linux 对 此 的 默认 动作 是 终止 相关 
进程 ， 而 Solaris 的 默认 动作 是 忽略 该 信和 号。 

SIGQUIT 当 用 户 在 终端 上 按 退 出 键 《〈 一 般 采 用 Ctrl+\) WY, BTS 
动 程序 产生 此 信号 ， 并 发 送 给 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9-9) 。 
台 进 程 组 〈 如 SIGINT 所 做 的 那样 ) ， 同 时 产生 一 个 
core CF. 

SIGSEGV 指示 进程 进行 了 一 次 无 效 的 内 存 引 用 (通常 说 明 程 序 有 
错 ， 比 如 访问 了 一 个 未 经 初始 化 的 指针 ) 。 

名 字 SEGV 代 表 “ 段 违例 ”(segmentation violation) 。 

SIGSTKFLT ”此 信号 仅 由 Linux 定 义 。 它 出 现在 Linux 的 早期 版 本 ， 
Ce eae eae 该 信号 并 非 由 内 核 产 生 ， 但 仍 保留 以 
Ay) PE 

SIGSTOP ”这 是 一 个 作业 控制 信号 ， 它 停止 一 个 进程 。 它 类 似 于 交 
互 停止 信号 (SIGTSTP) ， 但 是 SIGSTOP 不 能 被 捕捉 或 忽略 。 

SIGSYS 该 信号 指示 一 个 无 效 的 系统 调用 。 由 于 某 种 未 知 原因 ， 进 
程 执行 了 一 条 机 器 指令 ， 内 核 认 为 这 是 一 条 系统 调用 ， 但 该 指令 指示 系 
统 调 用 类 型 的 参数 却 是 无 效 鸭 。 这 种 情况 是 可 能 发 生 的 ， 例 如 ， 知 用 户 
编写 了 一 道 使 用 新 系统 调用 的 程序 ， 然 后 运行 该 程序 的 二 进 制 可 执行 代 
码 ， 而 所 用 的 操作 系统 却 是 不 支持 该 系统 调用 的 较 早 版 本 ， 于 是 就 出 现 
上 述 情 况 。 

SIGTERM 这 是 由 kill(1) 命 令 发 送 的 系统 默认 终止 信号 。 由 于 该 信号 
是 由 应 用 程序 捕获 的 ， 使 用 SIGTERM 也 让 程序 有 机 会 在 退出 之 前 做 好 
清理 工作 ， 从 而 优雅 地 终止 〈 相 对 于 SIGKILEL 而 言 。SIGKILL 不 能 被 捕 
捉 或 者 忽略 〉。 





























SIGTHAW 此 信号 仅 由 Solaris 定 义 。 在 被 挂 起 的 系统 恢复 时 ， 该 信 
号 用 于 通知 相关 进程 ， 它 们 需要 采取 特定 的 动作 。 

SIGTHR ”FreeBSD 线程 库 预 留 的 信号 ， 它 的 值 定 义 或 与 IGLWP 相 
Ej. 

SIGTRAP 指示 一 个 实现 定义 的 人 硬件 故障 。 

此 信号 名 来 自 于 PDP-11 的 TRAP 指 令 。 当 执行 断 点 指令 时 ， 实 现 常 
用 此 信号 将 控制 转移 至 调试 程序 。 

SIGTSTP 交互 停止 信号 ， 当 用 户 在 终端 上 按 挂 起 键 〈 一 般 采 用 
Ctrl+Z) 时 ， 终 端 驱 动 程序 产生 此 信号 。 该 信号 发 送 至 前 台 进 程 组 中 的 
所 有 进程 (参见 图 9-9) 。 

遗憾 的 是 ， 停 止 具有 不 同 的 含义 。 当 讨论 作业 控制 和 信号 时 ， 我 们 
谈 及 停止 和 继续 作业 。 但 是 ， 终 端 驱 动 程序 一 直 使 用 术语 “停止 "表示 用 
Ctrl+S 字 符 终 止 终端 输出 ， 为 了 继续 启动 该 终端 输出 ， 则 用 Ctrl+Q 字 
学 止 字 符 。 

SIGTTIN 当 一 个 后 台 进 程 组 进程 试图 读 其 控制 终端 时 ， 终 端 驱 动 程 
序 产生 此 信号 〈 见 9.8 节 中 对 此 问题 的 讨论 ) 。 在 下 列 例外 情形 下 不 产 
生 此 信号 : (a) 读 进 程 忽略 或 阻塞 此 信号 ; b) 读 进 程 所 属 的 进程 组 
是 孤儿 进程 组 ， 此 时 读 操 作 返 回 出 错 ，errno 设 置 为 EIO。 

SIGTTOU 当 一 个 后 人 台 进 程 组 进程 试图 写 其 控制 终端 时 ， 终 端 驱 动 
程序 产生 此 信号 〈 见 9.8 节 对 此 问题 的 讨论 ) 。 与 上 面 所 述 的 SIGTTIN 信 
号 不 同 ， 一 个 进程 可 以 选择 允许 后 台 进 程 写 控制 终端 。 第 18 章 将 讨论 如 
何 更 改 此 选项 。 

如 果 不 允 许 后 台 进 程 写 ， 则 与 SIGTTIN 相 似 ， 也 有 两 种 特殊 情况 : 
(a) 写 进 程 忽 略 或 阻塞 此 信号; (b) 写 进程 所 属 进程 组 是 孤儿 进程 
组 。 在 第 2 种 情况 下 不 产生 此 信号 ， 写 操作 返回 出 错 ，ermo 设 置 为 
EIO. 

不 论 是 否 允 许 后 台 进 程 写 ， 一 些 除 写 以 外 的 下 列 终端 操作 也 能 产生 
SIGTTOU 信 号 ， 如 tcsetattr、tcsendbreak、tcdrain、tcflush、tcflow 以 及 
tcsetpgrp。 第 18 章 将 说 明 这 些 终端 操作 。 

SIGURG 此 信号 通知 进程 已 经 发 生 一 个 紧急 情况 。 在 网 络 连接 上 接 
到 带 外 的 数据 时 ， 可 选择 地 产生 此 信和 号 。 

SIGUSR1 这 是 一 个 用 户 定义 的 信号 ， 可 用 于 应 用 程序 。 

SIGUSR2 这 是 另 一 个 用 户 定义 的 信号 ， 与 SIGUSR1 相 似 ， 可 用 于 
应 用 程序 。 

SIGVTALRM 当 一 个 由 setitimer(2) 函 数 设置 的 虚拟 间隔 时 间 已 经 超 
时 时 ， 产 生 此 信和 号 。 























SIGWAITING 此 信号 由 Solaris 线 程 库 内 部 使 用 ， 不 做 他 用 。 

SIGWINCH ”内 核 维 持 与 每 个 终端 或 伪 终 端 相 关联 窗口 的 大 小 。 进 
程 可 以 用 ioctl 函 数 〈( 见 18.12” 节 ) 得 到 或 设置 窗口 的 大 小 。 如 果 进 程 用 
ioctl 的 设置 窗口 大 小 命令 更 改 了 窗口 大 小 ， 则 内 核 将 SIGWINCH 信 号 发 
送 至 前 台 进 程 组 。 

SIGXCPU Single UNIX Specification 的 XSI 扩 展 支 持 资 源 限制 的 概念 
《 见 7.11 节 ) 。 如 果 进 程 超过 了 其 软 CPU 时 间 限 制 ， 则 产生 此 信和 号。 

在 图 10-1 中 ， 对 于 SIGXCPU 的 默认 动作 说 明 为 “终止 或 终止 
+core”。 访 默认 动作 依赖 于 操作 系统 。Linux 3.2.0 和 Solaris 10 支 持 的 默 
认 动 作 是 终止 并 创建 core 文 件 ，FreeBSD 8.0 和 Mac OS X 10.6.8 支 持 的 默 
认 动 作 是 终止 且 不 产生 core 文 件 。Single UNIX Specification 要 求 该 默认 
动作 是 ， 异 常 终 止 该 进程 ， 是 否 创建 core 文 件 则 留 给 实现 决定 。 

SIGXFSZ 如 果 进 程 超过 了 其 软文 件 长 度 限 制 〈 见 7.11 节 ) ， 则 产生 
此 信号 5 

如 同 SIGXCPU 一 样 ， 针 对 SIGXFSZ 的 默认 动作 依赖 于 操作 系统 。 
Linux 3.2.0 和 Solaris ”10 对 此 信号 的 默认 动作 是 终止 并 创建 core 文 件 。 
FreeBSD 8.0 和 Mac OS X 10.6.8 文 持 的 默认 动作 是 终止 且 不 产生 core 文 
f+. Single UNIX Specification 要 求 该 默认 动作 是 异常 终止 该 进程 ， 是 否 
创建 core 文 件 则 留 给 实现 决定 。 

SIGXRES 此 信号 仅 由 Solaris 定 义 。 可 选择 地 使 用 此 信和 号 以 通知 进程 
超过 了 预 配 置 的 资源 值 。Solaris 资 源 限 制 机 制 是 一 种 通用 设施 ， 用 于 控 
制 在 独立 应 用 集 之 间 共 享 资源 的 使 用 。 





10.3 chi Žtsignal 


UNIX 系 统 信号 机 制 最 简单 的 接口 是 signal 函 数 。 

#include <signal.h> 

void (*signal(int signo, void (*func)(int)))(int); 

返回 值 : 知 成 功 ， 返 回 以 前 的 信号 处 理 配 置 ; 知 出 错 ， 返 回 SIG_ERR 

signal 函 数 由 ISO C 定 义 。 因 为 ISO C 不 涉及 多 进程 、 进 程 组 以 及 终 
n 所 以 它 对 信和 号 的 定义 非常 含糊 ， 以 致 于 对 UNIX 系 统 而 言 几 乎 
= 5 

从 UNIX System V 派 生 的 实现 支持 signal 函 数 ， 但 该 函数 提供 旧 的 不 
可 靠 信 号 语义 (10.4 节 将 说 明 这 些 旧 的 语义 )。 提 供 此 函数 主要 是 为 了 
站 后 兼容 要 求 此 旧 语 义 的 应 用 程序 ， 新 应 用 程序 不 应 使 用 这 些 不 可 靠 信 
号 


4.4BSD 也 提供 signal 函数 ， 但 它 是 按照 sigaction 函数 定义 的 
(10.14 节 将 说 明 sigaction 函数 ) ， 所 以 在 4.4BSD 之 下 使 用 它 提供 新 的 
可 靠 信号 语义 。 目 前 大 多 数 系 统 遵循 这 种 策略 ， 但 Solaris 10 沿 用 System 
V signal 函 数 的 语义 。 

因为 signal 的 语义 与 实现 有 关 ， 上 所 以 最 好 使 用 sigaction 函 数 代 至 
signal 函 数 。 在 10.14 节 讨论 sigaction 函 数 时 ， 提 供 了 使 用 该 函数 的 signal 
的 一 个 实现 。 本 书 中 的 所 有 实例 均 使 用 图 10-18 中 给 出 的 signal 函 数 ， 这 
样 不 管 使 用 何 种 平台 都 可 以 有 一 致 的 语义 。 

signo 参 数 是 图 10-1 中 的 信号 名 。func 的 值 是 常量 SIG_IGN、 常 量 
SIG_DFL 或 当 接 到 此 信号 后 要 调用 的 函数 的 地 址 。 如 果 指 定 SIG_IGN， 
则 回 内 核 表示 忽略 此 信号 〈 记 住 有 两 个 信号 SIGKILL 和 SIGSTOP 不 能 忽 
MS) 。 如 果 指 定 SIG_DFL， 则 表示 接 到 此 信和 号 后 的 动作 是 系统 默认 动作 
〈 见 图 10-1 中 的 最 后 一 列 ) 。 当 指定 函数 地 址 时 ， 则 在 信号 发 生 时 ， 调 
用 该 函数 ， 我 们 称 这 种 处 理 为 捕捉 该 信号 ， 称 此 函数 为 信号 处 理 程序 
(signal handler) 或 信号 捕捉 函数 〈signal-catching function) 。 

signal 冰 数 原型 说 明 此 函数 要 求 两 个 参数 ， 返 回 一 个 函数 指针 ， 而 
该 指针 所 指 疝 的 函数 无 返回 值 (void) 。 第 一 个 参数 signo 是 一 个 整 型 
数 ， 第 二 个 参数 是 函数 指针 ， 它 所 指 癌 的 函数 需要 一 个 整 型 参数 ， 无 返 
回 值 。signal 的 返回 值 是 一 个 函数 地 址 ， 该 函数 有 一 个 整 型 参数 〈( 即 最 
后 的 (inD) 。 用 上 自然 语言 来 描述 也 就 是 要 回信 号 处 理 程序 传送 一 个 整 型 
参数 ， 而 它 却 无 返回 值 。 当 调用 signal 设 置信 号 处 理 程序 时 ， 第 二 个 参 











数 是 指 癌 该 函数 《也 就 是 信号 处 理 程序 ) 的 指针 。signal 的 返回 值 则 是 
指向 在 此 之 前 的 信 写 处 理 程序 的 指针 。 

很 多 系统 用 附加 的 依赖 于 实现 的 参数 来 调用 信号 处 理 程序 。10.14 
节 将 对 此 做 进一步 说 明 。 

本 世 开 头 所 示 的 Signal 函 数 原 型 太 复 杂 了 ， 如 采 使 用 下 面 的 
typedef[Plauger 1992]， 则 可 使 其 简单 一 些 。 

typedef void Sigfunc(int); 

然后 ， 可 将 Signal 函 数 原 型 写成 : 

Sigfunc *signal(int, Sigfunc *); 

我 们 已 将 此 typedef 包 括 在 apue.h 文 件 中 《〈 见 附录 B) ， 并 随 本 章 中 
的 函数 一 起 使 用 。 
如 果 查 看 系统 的 头 文件 <signal.h>， 则 很 可 能 会 找到 下 列 形式 的 声 
HH. 

#define SIG_ERR (void (*)(Q)-1 

#define SIG_DFL (void (*)())0 

#define SIG_IGN (void (*)())1 

Toe ae ae FY A RN“ FS I PRIA, AP BEER I SS 
数 ， 而 且 无 返回 值 ”。signal 的 第 二 个 参数 及 其 返回 值 就 可 用 它们 表示 。 
这 些 常 量 所 使 用 的 3 个 值 不 一 定 是 -1、0 和 1， 但 它们 必须 是 3 个 值 而 决 
a a 大 多 数 UNIX 系 统 使 用 上 面 所 示 的 值 。 

实例 

图 10-2 给 出 了 一 个 简单 的 信号 处 理 程序 ， 它 捕捉 两 个 用 户 定义 的 信 
oe es 10.10 F Ut AA pause re Zr, EE A ERE EE fe Bl] — 
言 写 前 挂 起 。 





#include "apue 
static void sig usr(int);/* one handler for both signals */ 


int 
main (void) 
| 
if (signal (SIGUSR], sig usr) == SIG ERR) 
err_sys("can't catch SIGUSRI"); 
if (signal (SIGUSR2，S1g usr) == SIG ERR) 
err sys("can't catch SIGUSR2"); 
for (j 7) 
pause () ; 


static void 
sig_usr(int signo) /* argument is signal number */ 


if (signo == SIGUSR1) 
printf ("received SIGUSRI\n") ; 
else if (signo == SIGUSR2) 
printf ("received SIGUSR2\n") ; 
else 
err dump("received signal d\n", signo); 


























图 10-2 捕捉 SIGUSR1 和 SIGUSR2 的 简单 程序 
我 们 使 该 程序 在 后 台 运 行 ， 并 且 用 kill(1) 命 令 将 信号 发 送 给 它 。 注 
意 ， 在 UNIX 系 统 中 ， 杀 死 kil)〉 这 个 术语 是 不 恰当 的 。k 训 1(1) 命 令 和 
kill(2) 函 数 只 是 将 一 个 信号 发 送 给 一 个 进程 或 进程 组 。 访 信号 是 否 终止 
进程 则 取决 于 该 信号 的 类 型 ， 以 及 进程 是 否 安排 了 捕捉 该 信和 号。 








$ /a.out & 在 后 台 启 动 进程 

[1] 7216 作业 控制 shell 打 印 作 业 编 号 和 进程 ID 
$ kill -USR1 7216 癌 该 进程 发 送 SIGUSR1 

received SIGUSR1 

$ kill -USR2 7216 癌 该 进程 发 送 SIGUSR2 

received SIGUSR2 

$ kill 7216 癌 该 进程 发 送 SIGTERM 


[1]+ Terminated ./a.out 

因为 执行 图 10-2 程 序 的 进程 不 捕捉 SIGTERM 信 和 号， 而 对 该 信号 的 
人 
x a o 

1. 程序 启动 

当 执 行 一 个 程序 时 ， 所 有 信和 号 的 状态 都 是 系统 默认 或 忽略 。 通 常 所 
有 信号 都 被 设置 为 它们 的 默认 动作 ， 除 非 调 用 exec 的 进程 忽略 该 信号 。 
确切 地 讲 ，exec 函 数 将 原先 设置 为 要 捕捉 的 信号 都 更 改 为 默认 动作 ， 其 
他 信号 的 状态 则 不 变 〔 一 个 进程 原先 要 捕捉 的 信号 ， 当 其 执行 一 个 新 程 
序 后 ， 束 不 能 再 捕捉 了 ， 因 为 信号 捕捉 函数 的 地 址 很 可 能 在 所 执行 的 新 
程序 文件 中 已 无 意义 ) 。 

一 个 具体 例子 是 一 个 交互 shell 如 何 处 理 针 对 后 人 台 进 程 的 中 断 和 退 
出 信号 。 对 于 一 个 非 作 业 控 制 shell， 当 在 后 台 执 行 一 个 进程 时 ， 例 如 : 

cc main.c & 

shell 上 自动 将 后 台 进 程 对 中 断 和 退出 信号 的 处 理 方式 设置 为 色 略 。 于 
是 ， 当 按 下 中 断 字 符 时 束 不 会 影响 到 后 台 进 程 。 如 果 没 有 做 这 样 的 处 
理 ， 那 么 当 按 下 中 断 字 符 时 ， 它 不 但 终止 前 台 进 程 ， 也 终止 所 有 后 台 进 


很 多 捕捉 这 两 个 信号 的 交互 程序 具有 下 列 形式 的 代码 : 

















void sig_int(int), sig_quit(int); 

if (signal(SIGINT, SIG_IGN) != SIG_IGN) 
signal(SIGINT, sig_int); 

if (signal(SIGQUIT, SIG_IGN) != SIG_IGN) 


signal(SIGQUIT, sig_quit); 

这 样 处 理 后 ， 仅 当 SIGINT 和 SIGQUIT 当 前 未 被 忽略 时 ， 进 程 才 会 
捕捉 它们 。 

从 signal 的 这 两 个 调用 中 也 可 以 看 到 这 种 函数 的 限制 : 不 改变 信和 号 
的 处 理 方式 就 不 能 确定 信号 的 当前 处 理 方式 。 我 们 将 在 本 章 的 稍 后 部 分 
说 明 使 用 sigaction 冰 数 可 以 确定 一 个 信号 的 处 理 方式 ， 而 无 需 改变 它 。 

2. 进程 创建 

当 一 个 进程 调用 fork 时 ， 其 子 进程 继承 父 进程 的 信号 处 理 方式 。 因 
为 子 进程 在 开始 时 复制 了 父 进程 内 存 上 映像， 所 以 信号 捕捉 函数 的 地 址 在 
子 进程 中 是 有 意义 的 。 


10.4 不 可 靠 的 信号 


在 早期 的 UNIX 版 本 中 (如 V7) ， 信 和 号 是 不 可 靠 的 。 不 可 靠 在 这 里 
指 的 是 ， 信 号 可 能 会 丢失 : 一 个 信号 发 生 了 ， 但 进程 却 可 能 一 直 不 知道 
这 一 点。 同时 ， 进 程 对 信号 的 控制 能 力也 很 差 ， 它 能 捕捉 信号 或 忽略 
它 。 有 时 用 户 和 希望 通知 内 核 阻 塞 某 个 信号: 不 要 名 略 该 信号 ， 在 其 发 生 
时 记 住 它 ， 然 后 在 进程 做 好 了 准备 时 再 通知 它 。 这 种 阻塞 信号 的 能 力 当 
时 并 不 具备 。 

4.2BSD 对 信号 机 制 进 行 了 更 改 ， 提 供 了 被 称 为 可 靠 信 号 的 机 制 。 然 
后 ，SVR3 也 修改 了 信号 机 制 ， 提 供 了 System V 可 靠 信 号 机 制 。POSIX.1 
选择 了 BSD 模 型 作为 其 标准 化 的 基础 。 

早期 版 本 中 的 一 个 问题 是 在 进程 每 次 接 到 信号 对 其 进行 处 理 时 ， 随 
即将 该 信号 动作 重 置 为 默认 值 〈 在 前 面 运行 图 10.2 程 序 时 ， 每 种 信号 只 
捕捉 一 次 ， 从 而 回避 了 这 一 点 ) 。 在 描述 这 些 早期 系统 的 编程 书籍 中 ， 
fy eee ne ree ees? as ae 
以 : 











int sig_int(); /* my signal handling function */ 


signal(SIGINT, sig_int); /* establish handler */ 
sig_int() 
{ 


signal(SIGINT, sig_int); /* reestablish handler for next time */ 
i /* process the signal ... */ 


} 

这 些 早 期 版 本 的 另 一 个 问题 是 : 在 进程 不 希望 某 种 信号 发 生 时 ， 它 
不 能 关闭 该 信号 。 进 程 能 做 的 一 切 就 是 忽略 该 信号 。 有 时 和 希望 通知 系 
统 “ 阻 止 下 列 信号 发 生 ， 如 果 它 们 确实 产生 了 ， 请 记 住 它们 。” 能 够 显现 
这 种 缺陷 的 的 一 个 经 典 实例 是 下 列 程序 段 ， 它 捕捉 一 个 信号 ， 然 后 设置 
一 个 表示 该 信号 已 发 生 的 标志 : 

int sig_int(); /* my signal handling function */ 

int sig_int_flag; /* set nonzero when signal occurs */ 

main() 


{ 











} 
signal(SIGINT, sig_int); /* establish handler */ 
while (sig_int_flag == 0) 


pause(); /* go to sleep, waiting for signal */ 

sig_int() 

(由 于 早期 的 C 语 言 版 本 不 支持 ISO C 的 void 数据 类 型 ， 所 以 将 信和 号 
处 理 程序 声明 为 int 类 型 。) 这 段 代 码 的 一 个 问题 是 : 在 信号 发 生 之 后 到 
信号 处 理 程序 调用 signal 函 数 之 间 有 一 个 时 间 窗 口 。 在 此 段 时 间 中 ， 可 
能 发 生 另 一 次 中 断 信 号 。 第 二 个 信号 会 造成 执行 默认 动作 ， 而 对 中 断 信 
号 的 默认 动作 是 终止 该 进程 。 这 种 类 型 的 程序 段 在 大 多 数 情况 下 会 正 毅 
工作 ， 使 得 我 们 认为 它们 是 正确 无 误 的 ， 而 实际 上 却 并 非 如 此 。 

{ 





signal(SIGINT, sig_int); /* reestablish handler for next time 
*/ 

sig_int_flag = 1; /* set flag for main loop to 
examine */ 


} 

其 中 ， 进 程 调用 pause 函数 使 自己 休眠 ， 直 到 捕捉 到 一 个 信号 。 当 
捕捉 到 信号 时 ， 信 号 处 理 程序 将 标志 sig_int_flag 设置 为 非 0 值 。 从 信 
号 处 理 程序 返回 后 ， 内 核 自 动 将 该 进程 唤醒 ， 它 检测 到 该 标志 为 非 0， 
然后 执行 它 所 需 做 的 。 但 是 这 里 有 一 个 时 间 窗 口 ， 在 此 窗口 中 操作 可 能 
失误 。 如 果 在 测试 sig_int_flag 之 后 、 调 用 pause 之 前 发 生 信号 ， 则 此 进程 
在 调用 pause 时 可 能 将 永久 休眠 《假定 此 信和 号 不 会 再 次 产生 ) 。 于 是 ， 
这 次 上 肥 生 的 信号 也 就 丢失 了 。 这 是 另 一 个 例子 ， 某 段 代 人 码 并 不 正确 ， 但 
是 大 多 数 时 间 却 能 正常 工作 。 要 查找 并 排除 这 种 类 型 的 问题 很 困难 。 











早期 UNIX 系 统 的 一 个 特性 是 : 如 果 进 程 在 执行 一 个 低速 系统 调用 
而 阻塞 期 间 捕 捉 到 一 个 信号 ， 则 该 系统 调用 就 被 中 断 不 再 继续 执行 。 该 
系统 调用 返回 出 错 ， 其 errno 设 置 为 EINTR。 这 样 处 理 是 因为 一 个 信号 发 
生 了 ， 进 程 捕捉 到 它 ， 这 意味 着 已 经 发 生 了 某 种 事情 ， 所 以 是 个 好 机 会 
应 当 唤 醒 阻 塞 的 系统 调用 。 

在 这 里 ， 我 们 必须 区 分 系统 调用 和 图 数 。 当 捕捉 到 某 个 信和 号 时 ， 被 
中 断 的 是 内 核 中 执行 的 系统 调用 。 

为 了 文 持 这 种 特性 ， 将 系统 调用 分 成 两 类 : 低速 系统 调用 和 其 他 系 
统 调 用 。 低 速 系统 调用 是 可 能 会 使 进程 永远 阻塞 的 一 类 系统 调用 ， 包 


括 : 

。 如 果 某 些 类 型 文件 〈 如 读 管 道 、 终 端 设备 和 网 络 设 备 ) 的 数据 不 
存在 ， 则 读 操 作 可 能 会 使 调用 者 永远 阻塞 ; 

如果 这 些 数据 不 能 被 相同 的 类 型 文件 立即 接受 ， 则 写 操 作 可 能 会 
使 调用 者 永远 阻塞 ; 

“在 菏 种 条 件 发 生 之 前 打开 某 些 类 型 文件 ， 可 能 会 发 生 阻塞 (例如 
要 打开 一 个 终端 设备 ， 需 要 先 等 待 与 之 连接 的 调制 解 调 器 应 符 ); 

“pause 函 数 〈 按 照 定义 ， 它 使 调用 进程 休 虐 直至 捕捉 到 一 个 信号) 
和 wait 了 水 数 ，; 

。 某 些 ioctl 操 作 ; 

“ 某 些 进程 间 通 信函 数 〈 见 第 15 章 ) 。 

在 这 些 低速 系统 调用 中 ， 一 个 值得 注意 的 例外 是 与 磁盘 IO 有 关 的 
系统 调用 。 虽 然 读 、 写 一 个 磁盘 文件 可 能 暂时 阻塞 调用 者 〈 在 磁盘 驱动 
程序 将 请 求 排 入 队列 ， 然 后 在 适当 时 间 执 行 请 求 期 间 ) ， 但 是 除非 发 生 
硬件 错误 ，LO 操 作 总 会 很 快 返回 ， 并 使 调用 者 不 再 处 于 阻 窗 状态 。 

可 以 用 中 断 系 统 调用 这 种 方法 来 处 理 的 一 个 例子 是 : 一 个 进程 启动 
了 该 终端 操作 ， 而 使 用 该 终端 设备 的 用 户 却 离 开 该 终端 很 长 时 间 。 在 这 
种 情况 下 ， 进 程 可 能 处 于 阻塞 状态 几 个 小 时 甚至 数 天 ， 除 非 系 统 停机 ， 
否则 一 直 如 此 。 

对 于 中 断 的 read、write 系 统 调 用 ，POSIX.1 的 语义 在 该 标准 的 2001 
版 有 所 改变 。 对 于 如 何 处 理 已 read、write ”部 分 数据 量 的 相应 系统 调 
用 ， 早 期 版 本 允许 实现 自行 选择 。 如 和 若 read 系 统 调用 已 接收 并 传送 数据 
至 应 用 程序 缓冲 区 ， 但 疝 未 接收 到 应 用 程序 请 求 的 全 部 数据 ， 此 时 被 中 





























呆 ， 操 作 系 统 可 以 认为 该 系统 调用 失败 ， 并 将 erno 设置 为 EINTR; 74 
一 种 处 理 方式 是 允许 该 系统 调用 成 功 返 回 ， 返 回 值 是 已 接收 到 的 数据 
量 。 与 此 类 似 ， 如 大 write 已 传输 了 应 用 程序 绥 冲 区 中 的 部 分 数据 ， 然 后 
被 中 断 ， 操 作 系 统 可 以 认为 该 系统 调用 失败 ， 并 将 errno 设 置 为 EINTR: 
另 一 种 处 理 方式 是 允许 该 系统 调用 成 功 返 回 ， 返 回 值 是 已 写 部 分 的 数据 
量 。 历 史上 ， 从 System V 派 生 的 实现 将 这 种 系统 调用 视 为 失败 ， 而 BSD 
i 2001 版 POSIX.1 标 准 采 用 BSD 风 格 
J 语义 。 
与 被 中 断 的 系统 调用 相关 的 问题 是 必须 显 式 地 处 理 出 错 返 回 。 典 型 
J (假定 进行 一 个 读 操作 ， 它 被 中 断 ， 我 们 希望 重新 启动 它 ) 
OF: 
again: 
if ((n = read(fd, buf, BUFFSIZE)) < 0) { 
if (errno == EINTR) 
goto again; /* just an interrupted system call */ 
/* handle other errors */ 


} 

为 了 帮助 应 用 程序 使 其 不 必 处 理 被 中 断 的 系统 调用 ，4.2BSD 引 进 了 
某 些 被 中 断 系 统 调用 的 目 动 重启 动 。 自 动 重启 动 的 系统 调用 包括 : 
ioctl, read. readv. write, writev. wait 和 waitpid。 如 前 所 述 ， 其 中 前 5 
个 函数 只 有 对 低速 设备 进行 操作 时 才 会 被 信号 中 断 。 而 wait 和 waitpid 在 
捕捉 到 信号 时 总 是 被 中 断 。 因 为 这 种 自动 重启 动 的 处 理 方 式 也 会 融 来 问 
题 ， 某 些 应 用 程序 并 不 希望 这 些 函 数 被 中 断后 重 局 动 。 为 此 4.3BSD 人 允许 
进程 基于 每 个 信号 禁用 此 功能 。 

POSIX.1 要 求 只 有 中 断 信 号 的 SA_RESTART 标 志 有 效 时 ， 实 现 才 重 
启动 系统 调用 。 在 10.14 节 将 看 到 ，sigaction 函 数 使 用 这 个 标志 人 允许 应 用 
程序 请 求 重 启动 被 中 断 的 系统 调用 。 

历史 上 ， 使 用 signal 函 数 建立 信号 处 理 程序 时 ， 对 于 如 何 处 理 被 中 
断 的 系统 调用 ， 各 种 实现 的 做 法 各 不 相同 。System V 的 默认 工作 方式 是 
从 不 重启 动 系统 调用 。 而 BSD 则 重启 动 被 信 号 中 断 的 系统 调用 。 
FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 当 信号 处 理 程序 是 用 
signal 函 数 时 ， 被 中 断 的 系统 调用 会 重启 动 。 但 Solaris 10 的 默认 方式 是 
出 错 返 回 ， 将 erno 设置 为 EINTR。 使 用 用 户 自己 实现 的 signal 函 数 〈 见 
图 10-18) 可 以 避免 必须 处 理 这 些 差 异 的 厂 烦 。 

4.2BSD 引 入 自动 重启 动 功能 的 一 个 理由 是 : 有 时 用 户 并 不 知道 所 使 
用 的 输入 、 输 出 设备 是 否 是 低速 设备 。 如 果 我 们 编写 的 程序 可 以 用 交互 
方式 运行 ， 则 它 可 能 读 、 写 终端 低速 设备 。 如 果 在 程序 中 捕捉 信号 ， 而 





























且 系 统 并 不 提供 重 局 动 功 能 ， 则 对 每 次 恋 、 写 系统 调用 就 要 进行 是 否 出 
错 返 回 的 测试 ， 如 果 是 被 中 断 的 ， 则 再 调用 读 、 写 系统 调用 。 
图 10-3 列 出 了 几 种 实现 所 提供 的 与 信号 有 关 的 函数 及 它们 的 语义 。 


信和 号 处 理 程 | 阻塞 信号 | Bt ia 
序 仍 被 安装 | 的 能 


ISOC, POSIX,] 
V7, SVR2, SVR3 
signal | SVR4, Solaris 


43BSD, 4.4BSD, FreeBSD, Linux, Mac OS X 


POSIX.1, 4.4BSD, SVR4, FreeBSD, Linux, 
Mac OS X, Solaris 


图 10-3 几 种 信号 实现 所 提供 的 功能 

应 当 了 解 ， 其 他 厂商 提供 的 UNIX 系 统 可 能 不 同 于 图 10-3 中 所 示 的 
情况 。 例 如 ，SunOS 4.1.2 中 的 sigaction 默 认 方式 是 重启 动 被 中 断 的 系统 
调用 ， 这 与 列 在 图 10-3 中 的 各 平台 不 同 。 

在 图 10-18 中 ， 提 供 了 我 们 自己 的 signal 函 数 版 本 ， 它 自动 地 党 试 重 
启动 被 中 断 的 系统 调用 ( 除 SIGALRM 信 和 号外) 。 在 图 10-19 中 则 提供 了 
男 一 个 函数 signal_intr， 它 不 进行 重启 动 。 

在 14.4 节 说 明 select 和 poll 函 数 时 ， 还 将 更 多 涉及 被 中 断 的 系统 调 
用 。 


sigaction 














10.6 F ME 


进程 捕捉 到 信和 号 并 对 其 进行 处 理 时 ， 进 程 正在 执行 的 正常 指令 序列 
就 被 信号 处 理 程序 临时 中 断 ， 它 首先 执行 该 信号 处 理 程序 中 的 指令 。 如 
果 从 信号 处 理 程序 返回 (例如 没有 调用 exit 或 1ongjmp) ， 则 继续 执行 
在 捕捉 到 信号 时 进程 正在 执行 的 正常 指令 序列 (这 类 似 于 发 生硬 件 中 断 
时 所 做 的 ) 。 但 在 信和 号 处 理 程序 中 ， 不 能 判断 捕捉 到 信号 时 进程 执行 到 
何 处 。 如 果 进 程 正 在 执行 malloc， 在 其 堆 中 分 配 另外 的 存储 空间 ， 而 此 
时 由 于 捕捉 到 信号 而 插入 执行 该 信号 处 理 程序 ， 其 中 又 调用 malloc， 这 
时 会 发生 什么 ?又 例如 ， 知 进程 正在 执行 getpwnam 〈 见 6.2 节 ) 这 种 将 
其 结果 存放 在 静态 存储 单元 中 的 函数 ， 其 间 插 入 执行 信号 处 理 程 序 ， 它 
又 调用 这 样 的 函数 ， 这 时 又 会 发 生 什 么 呢 ? 在 malloc 例 子 中 ， 可 能 会 对 
进程 造成 破坏 ， 因 为 malloc 通 常 为 它 所 分 配 的 存储 区 维护 一 个 链表 ， 而 
插入 执行 信号 处 理 程序 时 ， 进 程 可 能 正在 更 改 此 链表 。 在 getpwnam 的 例 
T, 1 EZS E e Wid HA AY 4 E YE SK [29 18S ch RE A 








abort faccessat select socketpair 
accept fchmod | sem post stat 


access fchmodat send symlink 
aio error fchown sendmsg symlinkat 


aio return fchownat sendto tedrain 





aio suspend | fentl setgid tcflow 
alarm fdatasync setpgid tcflush 
bind fexecve | setsid tegetattr 
cfgetispeed | fork setsockopt |tcgetpgrp 
cfgetospeed | fstat setuid tesendbreak 
cfsetispeed |fstatat shutdown tesetattr 
cfsetospeed | fsync Sigaction |tcsetpgrp 
chdir ftruncate sigaddset [time 





chmod futimens sigdelset timer_getoverrun 


chown getegid sigemptyset | timer gettime 
clock gettime | geteuid posix trace event |Sigfillset |timer settime 
close getgid pselect Sigismember | times 

connect getgroups raise signal umask 

creat getpeername | read sigpause uname 

dup getpgrp readlink sigpending |unlink 

dup2 getpid readlinkat sigprocmask |ulinkat 

exec] getppid recy sigqueue utime 
execle getsockname | recvfrom sigset utimensat 
execv getsockopt |recvmsg sigsuspend |utimes 
execve getuid rename sleep wait 





Exit kill renameat socketmark |waitpid 





exit link rmdir socket write 


图 10-4 信号 处 理 程序 可 以 调用 的 可 重 入 函数 

Single UNIX Specification 说 明了 在 信号 处 理 程序 中 保证 调用 安全 的 
函数 。 这 些 函数 是 可 重 入 的 并 被 称 为 是 异步 信号 安全 的 Casync-signal 
safe) 。 除 了 可 重 入 以 外 ， 在 信号 处 理 操 作 期 间 ， 它 会 阻塞 任何 会 引起 
不 一 致 的 信号 发 送 。 图 10-4 列 出 了 这 些 异 步 信 号 安全 的 函数 。 没 有 列 入 
图 10-4 中 的 大 多 数 函 数 是 不 可 重 入 的 ， 因 为 (Ca) 已 知 它 们 使 用 静态 数 
据 结构 : Cb) 它们 调用 malloc 或 free; (Cc) 它们 是 标准 IO 函数 。 标 准 
IO 库 的 很 多 实现 都 以 不 可 重 入 方式 使 用 全 局 数据 结构 。 注 意 ， 虽 然 在 
本 书 的 某 些 实例 中 ， 信 号 处 理 程序 也 调用 了 printf 函 数 ， 但 这 并 不 保证 
产生 所 期 望 的 结果 ， 信 号 处 理 程序 可 能 中 断 主 程序 中 的 printf 函 数 调 
用 


应 当 了 解 ， 即 使 信号 处 理 程 序 调用 的 是 图 10-4 中 的 函数 ， 但 是 由 于 
每 个 线程 只 有 一 个 errno 变 量 〈 回 忆 1.7 节 对 errno 和 线程 的 讨论 ) ， 所 以 
信号 处 理 程序 可 能 会 修改 其 原先 值 z 考虑 一 个 信号 处 理 程序 ， 它 恰好 在 
main 刚 设置 errno 之 后 被 调用 。 如 果 该 信号 处 理 程序 调用 read 这 类 函数 ， 
则 它 可 能 更 改 ermo 的 值 ， 从 而 取代 了 刚 由 main 设 置 的 值 。 因 此 ， 作 为 一 
个 通用 的 规则 ， 当 在 信号 处 理 程序 中 调用 图 10-4 中 的 函数 时 ， 应 当 在 调 
用 前 保存 errno， 在 调用 后 恢复 errno。 (应 当 了 解 ， 经 常 被 捕捉 到 的 信 
号 是 SIGCHLD， 其 信号 处 理 程 序 通 第 要 调用 一 种 wait 函 数 ， 而 各 种 wait 
函数 都 能 改变 errno。 ) 

注意 ， 图 10-4 没 有 包括 longjmp〈7.10 节 ) 和 siglongjmp (10.15 
W) 。 这 是 因为 主 例 程 以 非 可 重 入 方式 正在 更 新 一 个 数据 结构 时 可 能 产 
生 信 和 号。 如 果 不 是 从 信号 处 理 程序 返回 而 是 调用 siglongjmp， 那 么 该 数 
据 结构 可 能 是 部 分 更 新 的 。 如 果 应 用 程序 将 要 做 更 新 全 局 数据 结构 这 样 
的 事情 ， 而 同时 要 捕捉 某 些 信号 ， 而 这 些 信 号 的 处 理 程序 又 会 引起 执行 
ae 则 在 更 新 这 种 数据 结构 时 要 阻塞 此 类 信号。 

SEB 

图 10-5 给 出 了 一 段 程 序 ， 这 有 段 程序 从 信号 处 理 程序 my_alarm 调 用 非 
可 重 入 函数 getpwnam， 而 my_alarm 每 秒 钟 被 调用 一 次 。10.10 节 中 将 说 
明 alarm 函 数 。 在 该 程序 中 调用 alarm 函 数 使 得 每 秒 产 生 一 次 SIGALRM 信 


















































finclude "apue ,hn 
#include <pwd.h> 


static void 


my alarm(int signo) 


| 


int 


struct passwd *rootptr; 


printf ("in signal handler\n"); 

if ((rootptr = getpwnam("root")) == NULL) 
err sys("getpwnam(root) error"); 

alarm(1); 


main (void) 


| 


struct passwd *ptr; 


signal (SIGALRM, my alarm); 
alarm(1); 
for(i) | 
if ((ptr = getpwnam("sar")) == NULL) 
err sys("getpwnam error"); 
if (strcmp(ptr->pw name, "sar") != 0) 


printf ("return Value corrupted!, pw name = %s\n", 


ptr->pw name) ; 














图 10-5 在 信号 处 理 程序 中 调用 不 可 再 入 函数 

运行 该 程序 时 ， 其 结果 具有 随机 性 。 通 常 ， 在 信号 处 理 程 序 经 多 次 
迭代 返回 时 ， 该 程序 将 由 SIGSEGV 信 号 终止 。 检 查 core 文 件 ， 从 中 可 以 
看 到 main 函 数 已 调用 getpwnam， 但 当 getpwnam 调 用 free 时 ， 信 和 号 处 理 程 
序 中 断 了 它 的 运行 ， 并 调用 getpwnam， 进 而 再 次 调用 free。 在 信号 处 理 
程序 调用 free 而 主 程序 也 在 调用 free 时 ，malloc 和 free 维 护 的 数据 结构 就 
出 现 了 损坏 ， 人 偶然， 此 程序 会 运行 若干 秒 ， 然 后 因 产 生 SIGSEGV 信和 号 
而 终止 。 在 捕捉 到 信号 后 ， 知 main 函 数 仍 正 确 运 行 ， 其 返回 值 却 有 时 错 
误 ， 有 时 正确 。 

从 此 实例 中 可 以 看 出 ， 如 果 在 信号 处 理 程序 中 调用 一 个 非 可 重 入 函 
数 ， 则 其 结果 是 不 可 预知 的 。 

















10.7 SIGCLDi# Y 


SIGCLD 和 SIGCHLD 这 两 个 信号 很 容易 被 混 消 。SIGCLD (没有 
H) 是 System V 的 一 个 信号 名 ， 其 语义 与 名 为 SIGCHLD 的 BSD 信 号 不 
同 。POSIX.1 采 用 BSD 的 SIGCHLD 信 和 号。 

BSD 的 SIGCHLD 信 号 语义 与 其 他 信号 的 语义 相 类 似 。 子 进程 状态 
改变 后 产生 此 信号 ， 父 进程 需要 调用 一 个 wait 函 数 以 检测 发 生 了 什么 。 

System V 处 理 SIGCLD 信 号 的 方式 不 同 于 其 他 信号 。 如 采用 signal 或 
sigset 〈 早 期 设置 信号 配置 的 ， 与 SRV3 兼 容 的 函数 ) 设置 信号 配置 ， 则 
基于 SVR4 的 系统 继承 了 这 一 具有 问题 色彩 的 传统 〈 即 兼容 性 限制 ) 。 
对 于 SIGCLD 的 早期 处 理 方式 是 : 

C1) 如 果 进 程 明 确 地 将 该 信号 的 配置 设置 为 SIG_IGN， 则 调用 进 
程 的 子 进程 将 不 产生 僵 死 进程 。 注 意 ， 这 与 其 默认 动作 
(SIG_DFL) “忽略 ”( 见 图 10-1) 不 同 。 子 进程 在 终止 时 ， 将 其 状态 丢 
弃 。 如 果 调 用 进程 随后 调用 一 个 wait 函 数 ， 那 么 它 将 阻塞 直到 所 有 子 进 
程 都 终止 ， 然 后 该 wait 会 返回 -1， 并 将 其 errno 设 置 为 ECHILD。 OEIS 
号 的 默认 配置 是 忽略 ， 但 这 不 会 使 上 述 语义 起 作用 。 必 须 将 其 配置 明确 
指定 为 SIG_IGN 才 可 以 。) 

POSIX.1 并 未 说 明 在 SIGCHLD 被 忽略 时 应 产生 的 后 果 ， 所 以 这 种 
行为 是 允许 的 。Single UNIX ”Specification 的 XSI 扩 展 选 项 要 求 对 于 
SIGCHLD 支 持 这 种 行为 。 

如 果 SIGCHLD 被 忽略 ，4.4BSD 总 是 产生 僵 死 进程 。 如 果 要 避免 僵 
死 进程 ， 则 必须 等 待 子 进 程 。 在 SVR4 中 ， 如 果 调 用 signal 或 sigset 将 
SIGCHLD 的 配置 设置 为 忽略 ， 则 决 不 会 产生 僵 死 进程 。 本 书 讨 论 的 4 种 
平台 在 此 方面 都 追随 SVR4 的 行为 。 

使 用 sigaction 可 设置 SA_NOCLDWAIT 标 志 〈 见 图 10-6) 以 避免 进 
程 僵 死 。 本 书 讨论 的 4 种 平台 都 支持 这 一 点 。 

(2) 如 果 将 SIGCLD 的 配置 设置 为 捕捉 ， 则 内 核 立 即 检查 是 否 有 子 
进程 准备 好 被 等 待 ， 如 果 是 这 样 ， 则 调用 SIGCLD 处 理 程 序 。 

第 2 种 方式 改变 了 为 此 信号 编写 处 理 程序 的 方法 ， 这 一 点 可 在 下 面 
的 实例 中 看 到 。 

实例 

10.4 节 曾 提 到 ， 进 入 信号 处 理 程 序 后 ， 首 先 要 调用 signal 函 数 以 重新 
设置 此 信号 处 理 程序 〈 在 信号 被 重 置 为 其 默认 值 时 ， 它 可 能 会 丢失 ， 立 



































即 重新 设置 可 以 减少 此 窗口 时 间 ) 。 图 10-6 展 示 了 这 一 点 。 但 此 程序 不 
能 在 某 些 传统 的 System V 平台 上 正常 工作 。 程 序 一 行 行 地 不 断 重 复 输 
出 “SIGCLD received”， 最 后 进程 用 完 其 栈 空间 并 异常 终止 。 





#include "apue.h" 
#include <sys/wait.h> 


static void sig cld(int); 


int 
main () 
{ 
pid t pid; 


if (signal(SIGCLD, sig_cld) == SIG_ERR) 
perror ("signal error"); 

if ((pid = fork()) < 0) { 
perror ("fork error"); 

} else if (pid == 0) { /* child */ 
sleep (2); 
exit (0); 


pause(); /* parent */ 
exit (0); 


static void 


sig_cld(int signo) /* interrupts pause() */ 
{ 

pid_t pid; 

int status; 


printf ("SIGCLD received\n") ; 


if (signal(SIGCLD, sig cld) == SIG ERR) /* reestablish handler */ 
perror("signal error"); 


if ((pid = wait (&status)) < 0) /* fetch child status */ 


perror ("wait error"); 


printf ("pid = $d\n", pid); 




















图 10-6 不 能 正常 工作 的 System V SIGCLD 处 理 程序 

因为 基于 BSD 的 系统 通常 并 不 文 持 早期 System VÝJSIGCLD X, 
所 以 FreeBSD 8.0 和 Mac OS X 10.6.8 并 没有 出 现 此 问题 。Linux 3.2.0 也 
没有 出 现 此 问题 ， 其 原因 是 ， 虽 然 SIGCLD 和 SIGCHLD 定义 为 相同 的 
值 ， 但 当 一 个 进程 安排 捕捉 SIGCHLD， 并 且 已 经 有 进程 准备 好 由 其 父 


进 

程 等 待 时 ， 该 系统 并 不 调用 SIGCHLD 信 和 号 的 处 理 程序 。Solaris 10 
0 a 

虽然 本 书 说 明 的 所 有 4 种 平台 都 解决 了 这 一 问题 ， 但 是 应 当 意 识 到 
没有 解决 这 一 问题 的 平台 (如 AIX) 依然 存在 。 

此 程序 的 问题 是 : 在 信号 处 理 程 序 的 开始 处 调用 signal， 按 照 上 述 
第 2 种 方式 ， 内 核 检 查 是 否 有 需要 等 竺 的 子 进 程 〈 因 为 我 们 正在 处 理 一 
个 SIGCLD 信 和 号， 所 以 确实 有 这 种 子 进 程 ) ， 所 以 它 产 生 另 一 个 对 信和 号 
处 理 程序 的 调用 。 信 号 处 理 程序 调用 signal， 整 个 过 程 再 次 重复 。 

为 了 解决 这 一 问题 ， 应 当 在 调用 wait 取 到 子 进程 的 终止 状态 后 再 调 
用 signal。 此 时 仅 当 其 他 子 进程 终止 ， 内 核 才 会 再 次 产生 此 种 信和 号。 

如 果 为 SIGCHLD 建 立 了 一 个 信号 处 理 程序 ， 又 存在 一 个 已 终止 但 
父 进程 尚未 等 待 它 的 进程 ， 则 是 否 会 产生 信号 ? POSIX.1 对 此 没有 做 说 
明 。 这 就 允许 前 面 所 述 的 工作 方式 。 但 是 ，POSIX.1 在 信号 发 生 时 并 没 
有 将 信号 处 理 重 置 为 其 默认 值 〈 假 定 正 调用 POSIX.1 的 sigaction 冰 数 设 
置 其 配置 ) ， 于 是 在 SIGCHLD 处 理 程序 中 也 就 不 必 再 为 该 信号 指定 一 
个 信号 处 理 程序 。 

务必 了 解 你 所 用 的 系统 实现 中 SIGCHLD 信号 的 语义 。 也 应 了 解 在 
某 些 系统 中 #define SIGCHLD 为 SIGCLD 或 反之 。 更 改 这 种 信号 的 名 字 使 
你 可 以 编译 为 另 一 个 系统 编写 的 程序 ， 但 是 如 果 这 一 程序 使 用 该 信号 的 
男 一 种 语义 ， 程 序 有 可 能 不 会 正常 工作 。 

在 本 书 说 明 的 4 种 平台 上 ， 只 有 Linux ”3.2.0 和 Solaris ”10 定 义 了 
SIGCLD，SIGCLD 等 同 于 SIGCHLD。 





























10.8 可 靠 信号 术语 和 语 》 


我 们 需要 先 定义 一 些 在 讨论 信号 时 会 用 到 的 术语 。 首 先 ， 当 造成 信 
号 的 事件 发 生 时 ， 为 进程 产生 一 个 信号 (或 向 一 个 进程 发 送 一 个 信 
写 ) 。 事 件 可 以 是 硬件 异常 (如 除 以 0) 、 软 件 条 件 〈 如 alarm 定时 器 
超时 ) 、 终 端 产 生 的 信和 号 或 调用 kill 函数 。 当 一 个 信号 产生 时 ， 内 核 通 
党 在 进程 表 中 以 某 种 形式 设置 一 个 标志 。 

当 对 信号 采取 了 这 种 动作 时 ， 我 们 说 向 进程 递送 了 一 个 信号 。 在 信 
号 产生 〈generation) 和 递送 (delivery) 之 间 的 时 间 间 隔 内 ， 称 信号 是 
未 决 的 (pending) 。 

进程 可 以 选用 “阻塞 信号 递送 ”。 如 果 为 进程 产生 了 一 个 阻塞 的 信 
号 ， 而 且 对 该 信号 的 动作 是 系统 默认 动作 或 捕捉 该 信号 ， 则 为 该 进程 将 
此 信号 保持 为 未 决 状态 ， 直 到 该 进程 对 此 信和 号 解除 了 阻塞 ， 或 者 将 对 此 
信号 的 动作 更 改 为 忽略 。 内 核 在 递送 一 个 原来 被 阻塞 的 信号 给 进程 时 
(而 不 是 在 产生 该 信号 时 ) ， 才 决定 对 它 的 处 理 方式 。 于 是 进程 在 信和 号 
递送 给 它 之 前 仍 可 改变 对 该 信号 的 动作 。 进 程 调 用 sigpending 函 数 〈 见 
10.13 节 ) 来 判定 哪些 信号 是 设置 为 阻塞 并 处 于 未 决 状态 的 。 

如 果 在 进程 解除 对 某 个 信号 的 阻塞 之 前 ， 这 种 信号 发 生 了 多 次 ， 那 
么 将 如 何 呢 ? POSIX.1 人 允许 系统 递送 该 信号 一 次 或 多 次 。 如 果 递 送 该 信 
号 多 次 ， 则 称 这 些 信号 进行 了 排队 。 但 是 除非 文 持 POSIX.1 实 时 扩展 ， 
否则 大 多 数 UNIX 并 不 对 信和 号 排队 ， 而 是 只 递送 这 种 信号 一 次 。 

SUSv4 中 ， 实 时 信号 功能 已 经 移 至 基础 规范 的 实时 扩展 部 分 。 随 着 
时 间 的 推移 ， 更 多 的 系统 即使 不 支持 实时 扩展 ， 也 会 文 持 信号 排队 。 我 
们 将 在 10.20 节 中 进一步 讨论 排队 信和 号 。 

SVR2 的 手册 页 称 ， 在 进程 执行 SIGCLD 信号 处 理 程序 期 间 ， 该 信 
写 是 用 排队 方式 处 理 的 ， 虽 然 在 概念 层次 这 可 能 是 真 的 ， 但 实际 并 非 如 
此 。 内 核 是 按照 10.7 节 中 所 述 方式 产生 此 信号 。SVR3 的 手册 页 对 此 做 
了 修改 ， 它 指明 在 进程 执行 SIGCLD 信 号 处 理 程序 期 间 ， 和 忽略 SIGCLD 
信号 。SVR4 手 册页 删除 了 有 关 部 分 。 

AT&T[1990e] 中 的 SVR4 sigaction(2) 手 册页 称 SA_SIGINFO 标 志 〔( 见 
图 10-16) 使 信号 可 靠 地 排队 ， 这 是 不 正确 的 。 表面 上 内 核 部 分 地 实现 
了 此 功能 ， 但 在 SVR4 中 并 不 起 作用 。 令 人 不 可 思议 的 是 ， 
SVID (System V 接 口 定义 ) 对 这 种 可 靠 队 列 并 未 做 同样 的 声明 。 

如 果 有 多 个 信号 要 递送 给 一 个 进程 ， 那 将 如 何 呢 ? POSIX.1 并 没有 























规定 这 些 信号 的 递送 顺序 。 但 是 POSIX.1 基 础 部 分 建议 : 在 其 他 信号 之 
前 递送 与 进程 当前 状态 有 关 的 信号 ， 如 SIGSEGYV。 

每 个 进程 都 有 一 个 信号 屏蔽 字 (signal mask) ， 它 规定 了 当前 要 阻 
塞 递 送 到 该 进程 的 信号 集 。 对 于 每 种 可 能 的 信号 ， 该 屏蔽 字 中 都 有 一 位 
与 之 对 应 。 对 于 某 种 信号 ， 知 其 对 应 位 已 设置 ， 则 它 当 前 是 被 阻 赛 的 。 
进程 可 以 调用 sigprocmask〔 在 10.12 节 中 说 明 ) 来 检测 和 更 改 其 当前 信 
5 ENCE © 

信号 编号 可 能 会 超过 一 个 整 型 所 包含 的 二 进 制 位 数 ， 因 此 POSIX.1 
定义 了 一 个 新 数据 类 型 sigset t， 它 可 以 容纳 一 个 信号 集 。 例 如 ， 信 号 屏 
eee ane 。10.11 市 将 说 明 对 信号 集 进行 操作 的 5 
MEE 














10.9 Pk 2Vkill# raise 


eater > raise K cll iPS Ae 
Ris © 

raise 最 初 是 由 ISO CE XIN. JAK, AS SISO C 标 准 保持 一 致 ， 
POSIX.1 也 包括 了 该 函数 。 但 是 POSIX.1 扩 展 了 raise 的 规范 ， 使 其 可 处 理 
线程 (12.8 中 讨论 线程 如 何 与 信号 交互 )。 

因为 ISO© C 并 不 涉及 多 进程 ， 所 以 它 不 能 定义 以 进程 ID 作 为 其 参数 
(如 Kill 函数 ) 的 函数 。 

#include <signal.h> 

int kill(pid_t pid, int signo); 

int raise(int signo); 

两 个 函数 返回 值 : 知 成 功 ， 返 回 0; AB, e- 

调用 

raise(signo); 

等 价 于 调用 

kill(getpidQ), signo); 

kil 的 pid 参 数 有 以 下 4 种 不 同 的 情况 。 

pid > 0 将 该 信号 发 送 给 进程 ID 为 pid 的 进程 。 

pid == 0 将 该 信号 发 送 给 与 发 送 进程 属于 同一 进程 组 的 所 有 进程 
(这 些 进 程 的 进程 组 ID 等 于 发 送 进程 的 进程 组 ID) ， 而 且 发 送 进程 具 
有 权限 同 这 些 进 程 发 送信 号 。 这 里 用 的 术语 “所 有 进程 ”不 包括 实现 定义 
对 于 大 多 数 UNIX 系 统 ， 系 统 进程 集 包 括 内 核 进 程 和 
init (pid 为 1) 。 

pid < 0 将 该 信号 发 送 给 其 进程 组 ID 等 于 pid 绝 对 值 ， 而 且 发 送 进程 
具有 权限 向 其 发 送信 号 的 所 有 进程 。 如 前 所 述 ， 所 有 进程 并 不 包括 系统 
进程 集中 的 进程 。 

pid == -1 将 该 信号 发 送 给 发 送 进程 有 权限 同 它 们 发 送信 号 的 所 有 
进程 。 如 前 所 述 ， 所 有 进程 不 包括 系统 进程 集中 的 进程 。 

如 前 所 述 ， 进 程 将 信号 发 送 给 其 他 进程 需要 权限 。 超 级 用 户 可 将 信 
号 发 送 给 任 一 进程 。 对 于 非 超级 用 户 ， 其 基本 规则 是 发 送 者 的 实际 用 户 
ID 或 有 效用 户 ID 必须 等 于 接收 者 的 实际 用 户 ID 或 有 效用 户 ID。 如 果 
实现 支持 _POSIX_SAVED_IDS (如 POSIX.1 现 在 要 求 的 那样 )， 则 检查 
接收 者 的 保存 设置 用 户 ID (而 不 是 有 效用 户 ID〉。 在 对 权限 进行 测试 时 





也 有 一 个 特例 : 如 果 被 发 送 的 信号 是 SIGCONT， 则 进程 可 将 它 发 送 给 
属于 同一 会 话 的 任 一 其 他 进程 。 

POSIX.1 将 信号 编号 0 定义 为 空 信 号 。 如 果 signo 参 数 是 0(， 则 kill 仍 执 
行 正 常 的 错误 检查 ， 但 不 发 送信 号 。 这 常 被 用 来 确定 一 个 特定 进程 是 否 
仍然 存在 。 如 果 向 一 个 并 不 存在 的 进程 发 送 空 信 号 ， 则 k 记 返回 -1， 
errno 被 设置 为 ESRCH。 但 是 ， 应 当 注 意 ，UNIX 系 统 在 经 过 一 定时 间 后 
会 重新 使 用 进程 ID， 所 以 一 个 现 有 的 具有 所 给 定 进程 ID 的 进程 并 不 一 冠 
就 是 你 所 想 要 的 进程 。 

还 应 理解 的 是 ， 测 试 进 程 是 否 存在 的 操作 不 是 原子 操作 。 在 kill 癌 
调用 者 返回 测试 结果 时 ， 原 来 已 存在 的 被 测试 进程 此 时 可 能 已 经 终止 ， 
所 以 这 种 测试 并 无 多 大 价值 。 

如 果 调 用 kil 为 调用 进程 产生 信号 ， 而 且 此 信号 是 不 被 阻塞 的 ， 那 
么 在 k 记 返回 之 前 ， signo 或 者 某 个 其 他 未 决 的 、 非 阻塞 信号 被 传送 至 该 
进程 。( 对 于 线程 而 言 ， 还 有 一 些 附加 条 件 ; 详细 情况 见 12.8 节 。) 














10.10 打数 alarm 和 pause 


使 用 alarm 函 数 可 以 设置 一 个 定时 器 ( 疗 钟 时 间 〉 ， 在 将 来 的 某 个 
时 刻 该 定时 器 会 超时 。 当 定时 器 超时 时 ， 产 生 SIGALRM 信和 号。 如果 忽 
略 或 不 捕捉 此 信号 ， 则 其 默认 动作 是 终止 调用 该 alarm 函 数 的 进程 。 

#include <unistd.h> 

unsigned int alarm(unsigned int seconds); 

返回 值 : 0 或 以 前 设置 的 闹钟 时 间 的 余 留 秒 数 

参数 seconds 的 值 是 产生 信号 SIGALRM 需 要 经 过 的 时 钟 秒 数 。 当 这 
一 时 刻 到 达 时 ， 信 号 由 内 核 产 生 ， 由 于 进程 调度 的 延迟 ， 所 以 进程 得 到 
控制 从 而 能 够 处 理 该 信号 还 需要 一 个 时 间 间 隔 。 

早期 的 UNIX 系 统 实现 曾 提出 警告 ， 这 种 信号 可 能 比 预 定 值 提 前 1 s 
发 送 。POSIX.1 则 不 允许 这 样 做 。 

每 个 进程 只 能 有 一 个 曾 钟 时 间 。 如 果 在 调用 alarm 时 ， 之 前 已 为 该 
进程 注册 的 闹钟 时 间 还 没有 超时 ， 则 该 闹钟 时 间 的 余 留 值 作 为 本 次 
alarm 函 数 调 用 的 值 返回 。 以 前 注册 的 闹钟 时 间 则 被 新 值 代 蔡 。 

如 果 有 以 前 注册 的 尚未 超过 的 周 钟 时 间 ， 而 且 本 次 调用 的 seconds 值 
是 0(， 则 取消 以 前 的 闹钟 时 间 ， 其 余 留 值 仍 作为 alarm 函 数 的 返回 值 。 

虽然 SIGALRM 的 默认 动作 是 终止 进程 ， 但 是 大 多 数 使 用 曾 钟 的 进 
程 捕捉 此 信号 。 如 果 此 时 进程 要 终止 ， 则 在 终止 之 前 它 可 以 执行 所 需 的 
清理 操作 。 如 果 我 们 想 捕捉 SIGALRM 信号 ， 则 必须 在 调用 alarm 之 前 
安装 该 信号 的 处 理 程序 。 如 果 我 们 先 调 用 alarm， 然 后 在 我 们 能 够 安装 
SIGALRM 处 理 程序 之 前 已 接 到 该 信号 ， 那 么 进程 将 终止 。 

pause 函 数 使 调用 进程 挂 起 直至 捕捉 到 一 个 信号 。 

#include <unistd.h> 

int pause(void); 

返回 值 : -1，errno 设 置 为 EINTR 

只 有 执行 了 一 个 信号 处 理 程序 并 从 其 返回 时 ，pause 才 返回 。 在 这 
种 情况 下 ，pause 返 回 -1， errno 设 置 为 EINTR.。 

实例 

使 用 alarm 和 pause， 进 程 可 使 自己 休眠 一 段 指 定 的 时 间 。 图 10-7 中 
a (其 实 这 里 面 存 在 问题 ， 我 们 很 快 就 
会 看 到 ) 。 


村 nclude 《Signal ,h> 
include <unistd.h> 


static void 
sig_alrm(int signo) 
| 


/* nothing to do, just return to wake up the pause */ 


unsigned int 
sleep] (unsigned int seconds) 
| 
if (signal (SIGALRM, sig alrm) == SIG ERR) 
return (seconds) ; 


alarm(seconds) ; /* start the timer */ 
pause (); /* next caught signal wakes us up */ 
return (alarm (0) ); /* turn off timer, return unslept time */ 


图 10-7 sleep 简 化 而 不 完整 的 实现 

程序 中 的 sleep1 函 数 看 起 来 与 将 在 10.19 节 中 说 明 的 Sleep 函数 类 似 ， 
但 这 种 简单 实现 有 以 下 3 个 问题 。 

(1) 如 果 在 调用 sleep1l 之 前 ， 调 用 者 已 设置 了 闸 钟 ， 则 它 被 sleep1 
函数 中 的 第 一 次 alarm 调 用 控 除 。 可 用 下 列 方 法 更 正 这 一 点 : 检查 第 一 
次 调用 alarm 的 返回 值 ， 如 其 值 小 于 本 次 调用 alarm 的 参数 值 ， 则 只 应 等 
到 已 有 的 曾 钟 超时 。 如 果 之 前 设置 的 周 钟 超时 时 间 晚 于 本 次 设置 值 ， 则 
AS 返回 之 前 ， 重 置 此 曾 钟 ， 使 其 在 之 前 曾 钟 的 设 定时 间 再 次 

AH 

(2) 该 程序 中 修改 了 对 SIGALRM 的 配置 。 如 果 编 写 了 一 个 函数 
供 其 他 函数 调用 ， 则 在 该 函数 被 调用 时 先 要 保存 原配 置 ， 在 该 函数 返回 
前 再 恢复 原配 置 。 更 正 这 一 点 的 方法 是 : 保存 signal 函 数 的 返回 值 ， 在 











返回 前 重 置 原配 置 。 

(3) 在 第 一 次 调用 alarm 和 pause 之 间 有 一 个 竞争 条 件 。 在 一 个 党 忙 
的 系统 中 ， 可 能 alarm 在 调用 pause 之 前 超时 ， 并 调用 了 信和 号 处 理 程 序 。 
如 果 发 生 了 这 种 情况 ， 则 在 调用 pause 后 ， 如 果 没 有 捕捉 到 其 他 信号 ， 
调用 者 将 永远 被 挂 起 。 

sleep 的 早期 实现 与 图 10-7 程 序 类 似 ， 但 更 正 了 第 1 个 和 第 2 个 问题 。 
有 两 种 方法 可 以 更 正 第 3 个 问题 。 第 一 种 方法 是 使 用 setjmp， 下 一 个 实例 
将 说 明 这 种 方法 。 男 一 种 方法 是 使 用 sigprocmask 和 sigsuspend，10.19 市 
将 说 明 这 种 方法 。 

实例 

SVR2 中 的 sleep 实 现 使 用 了 setjimp 和 longjmp (7.1075) ， 以 避免 
前 一 个 实例 的 第 3 个 问题 中 说 明 的 竞争 条 件 。 此 函数 的 一 个 简化 版 本 称 
为 sleep2， 示 于 图 10-8 中 (为 了 缩短 实例 程序 的 长 度 ， 程 序 中 没有 人 处 理 
上 面 所 说 的 第 1 个 和 第 2 个 问题 ) 。 


村 nclude <setjmp,h> 
include  <signal,h> 
include <unistd.h> 


static Jmp buf env alrm; 


static void 
sig_alrm(int signo) 
| 


longjmp (env alrm, 1); 


unsigned int 
sleep? (unsigned int seconds) 
| 
if (signal (SIGALRM, sig_alrm) == SIG ERR) 
return (seconds) ; 
if (setjmp(env_alrm) == 0) { 


alarm (seconds) ; /* start the timer */ 
pause () ; /* next caught signal wakes us up */ 
return (alarm(0)); /* turn off timer, return unslept time */ 


图 10-8 sleep 的 另 一 个 不 完善 的 实现 
在 此 函数 中 ， 已 避免 了 图 10-7 中 具有 的 竞 争 条 件 。 即 使 pause MA 
执行 ， 在 发 生 SIGALRM 时 ，sleep2 函 数 也 返回 。 
但 是 ，sleep2 水 数 中 却 有 男 一 个 难以 察觉 的 问题 ， 它 涉及 与 其 他 信 
号 的 交互 。 如 果 SIGALRM 中 断 了 某 个 其 他 信号 处 理 程序 ， 则 调用 








longjmp 会 提早 终止 该 信号 处 理 程序 。 图 10-9 显 示 了 这 种 情况 。SIGINT 
处 理 程 序 中 包含 了 for 循环 语句 ， 它 在 作者 所 用 系统 上 的 执行 时 间 超 过 
5s， 也 就 是 大 于 sleep2 的 参数 值 ， 这 正 是 我 们 想 要 的 。 整 型 变量 k 说 明 为 
volatile， 这 样 就 阻止 了 优化 编译 程序 去 除 循 环 语句 。 


tinclude "apue.h" 


unsigned int sleep? (unsigned int); 


static void Sig_int (int); 


int 
main (void) 
| 


unsigned int unslept; 


if (signal (SIGINT, sig_int) == SIG ERR) 
err sys("signal (SIGINT) error"); 

unslept = sleep? (5); 

printf ("sleep2 returned: %u\n", unslept); 

exit (0); 


static void 

sig int (int signo) 

| 
int ly i 
volatile int k; 


/* 

* Tune these loops to run for more than 5 seconds 

* on whatever system this test program is run, 

tj 
printf ("\nsig int starting\n"); 

for (i = 0; i < 300000; itt) 

for (j = 0; J < 4000; j++) 
ktat g) 
printf ("sig int finished\n"); 








图 10-9 在 一 个 捕捉 其 他 信号 的 程序 中 调用 sleep2 
执行 图 10-9 中 的 程序 ， 可 以 通过 键入 中 断 字 符 来 中 断 体 眠 ， 运 行 结 
果 如 下 : 


$ ./a.out 


AC 键入 中 断 字 符 

sig_int starting 

sleep2 returned: 0 

从 中 可 见 sleep2 函 数 所 引起 的 longjmp 使 另 一 个 信号 处 理 程 序 sig_int 
提早 终止 ， 即 使 它 未 完成 也 会 如 此 。 如 果 将 SVR2 的 Sleep 函数 与 其 他 信 
号 处 理 程序 一 起 使 用 ， 就 可 能 碰 到 这 种 情况 。 见 习题 10.3。 

sleep1 和 sleep2 函数 的 这 两 个 实例 是 告诉 我 们 在 涉及 信和 号 时 需要 有 
精细 而 周到 的 考虑 。 下 面 儿 市 将 说 明 解 决 这 些 问题 的 方法 ， 使 我 们 能 够 
— teas 其 他 代码 段 的 情况 下 处 理 信 和 号 。 

KH 

除了 用 来 实现 sleep 函 数 外 ，alarm 还 常用 于 对 可 能 阻塞 的 操作 设置 
时 间 上 限 值 。 例 如 ， 程 序 中 有 一 个 读 低 速 设备 的 可 能 阻 友 的 操作 《〈 见 
10.5 3) ， 我 们 希望 超过 一 定时 间 量 后 就 停止 执行 该 操作 。 图 10-10 实 
现 了 这 一 点 ， 它 从 标准 输入 读 一 行 ， 然 后 将 其 写 到 标准 输出 上 。 





finclude "apue.h" 


static void sig_alrm/(int); 


int 
main (void) 
| 


int n; 


char line [MAXLINE]; 


1f (signal (SIGALRM, sig_alrm) == SIG ERR) 
err sys("signal (SIGALRM) error"); 


alarm(10); 

lf ((n = read(STDIN FILENO, line, MAXLINE)) < 0) 
err_sys("read error"); 

alarm(0); 


write (STDOUT FILENO, line, n); 
exit (0); 


static void 
sig alrm(int signo) 
| 


/* nothing to do, just return to interrupt the read */ 





图 10-10 带 时 间 限 制 调用 read 
rene nner ree etn ee nena! 
上 问题 : 

(1) 图 10-10 中 的 程序 具有 与 图 10-7 中 的 程序 相同 的 问题 : 在 第 一 
次 alarm 调用 和 read 调 用 之 间 有 一 个 竞争 条 件 。 如 果 内 核 在 这 两 个 函数 
调用 之 间 使 进程 阻塞， 不 能 占用 处 理 机 运行 ， 而 其 时 间 长 度 又 超过 曾 钟 
时 间 ， 则 read 可 能 永远 阻塞 。 大 多 数 这 种 类 型 的 操作 使 用 较 长 的 周 钟 时 
间 ， 例 如 1 分 钟 或 更 长 一 点 ， 使 这 种 问题 不 会 发 生 ， 但 无 论 如 何 这 是 一 
个 竞争 条 件 。 


(2) 如 果 系 统 调用 是 自动 重启 动 的 ， 则 当 从 SIGALRM 信 号 处 理 程 








序 返 回 时 ，read 并 不 被 中 断 。 在 这 种 情形 下 ， 设 置 时 间 限 制 不 起 作用 。 

在 这 里 我 们 确实 需要 中 断 慢 速 系统 调用 。 我 们 将 在 10.14 节 对 此 进 
行 详 细 讨 论 。 

实例 

让 我 们 用 longjmp 再 实现 前 面 的 实例 。 使 用 这 种 方法 无 需 担 心 一 个 
慢 速 的 系统 调用 是 否 被 中 断 ， 见 图 10-11。 


tinclude "apue 
finclude <setjmp.h> 


static void $ig_alrm(int) ; 
static jmp buf env alrm; 


int 
main(void) 
| 
int nj 
char line [MAXLINE] ; 


if (signal (SIGALRM, sig_alrm) == SIG ERR) 
err sys("signal (SIGALRM) error"); 

1f (setjmp(env_alrm) != 0) 
err quit ("read timeout"); 


alarm(10); 
if ((n = read(STDIN FILENO, line, MAXLINE)) < 0) 
err sys("read error"); 


alarm(0); 


write (STDOUT FILENO, line, n); 
exit (0); 


static void 
sig_alrm(int signo) 
| 


longjmp(env_alrm, 1); 


图 10-11 使 用 longjmp， 带 时 间 限 制 调用 read 
不 管 系统 是 否 重新 局 动 被 中 断 的 系统 调用 ， 访 程序 都 会 如 所 预期 的 
那样 工作 。 但 是 要 知道 ， 该 程序 仍旧 有 和 图 10-8 中 的 程序 相同 的 与 其 他 
信号 处 理 程序 交互 的 问题 。 
如 果 要 对 WO 操作 设置 时 间 限 制 ， 则 如 上 所 示 可 以 使 用 longjmp， 妆 
然 也 要 清楚 它 可 能 有 与 其 他 信号 处 理 程序 交互 的 问题 。 另 一 种 选择 是 使 
用 select 或 pol] 函 数 ，14.4.1 节 和 14.4.2 节 将 对 它们 进行 说 明 。 





10.11 {8-5 


我 们 需要 有 一 个 能 表示 多 个 信和 号 信号 集 (signal set) 的 数据 类 
型 。 我 们 将 在 sigprocmask 《下 一 市 中 说 明 〉 类 函数 中 使 用 这 种 数据 类 
型 ， 以 便 告诉 内 核 不 允许 发 生 该 信号 集中 的 信号 。 如 前 所 述 ， 不 同 的 信 
号 的 编号 可 能 超过 一 个 整 型 量 所 包含 的 位 数 ， 所 以 一 般 而 言 ， 不 能 用 整 
型 量 中 的 一 位 代表 一 种 信号 ， 也 就 是 不 能 用 一 个 整 型 量 表示 信号 集 。 
POSIX.1 定 义 数 据 类 型 sigset_t 以 包含 一 个 信号 集 ， 并 且 定 义 了 下 列 5 个 处 
理 信号 集 的 函数 。 
#include <signal.h> 
int sigemptyset(sigset_t *set); 
int sigfillset(sigset_t *set); 
int sigaddset(sigset_t *set, int signo); 
int sigdelset(sigset_t *set, int signo); 
4 个 函数 返回 值 : ARJ, Reo; Aht, e- 
int sigismember(const sigset_t *set, int signo); 
返回 值 : GH, ill; Atk, iz 
pki Bsigemptyset*#J4a tt Hse fa ote, ARRERA IE Ss. PM 
数 sigfillset 初 始 化 由 set 指 向 的 信号 集 ， 使 其 包括 所 有 信号 。 所 有 应 用 程 
序 在 使 用 信和 号 集 前 ， 要 对 该 信号 集 调用 sigemptyset 或 sigfillset 一 次 。 这 
是 因为 C 编 译 程序 将 不 赋 初 值 的 外 部 变量 和 静态 变量 都 初始 化 为 0， 而 这 
是 否 与 给 定 系统 上 信号 集 的 实现 相对 应 却 并 不 清楚 。 
一 且 已 经 初始 化 了 一 个 信号 集 ， 以 后 就 可 在 该 信号 集中 增 、 删 特定 
的 信号 。 函 数 sigaddset 将 一 个 信号 诬 加 到 已 有 的 信号 集中 ，sigdelset 则 
从 信号 集中 删除 一 个 信号 。 对 所 有 以 信号 集 作 为 参数 的 函数 ， 总 是 以 信 
号 集 地 址 作为 癌 其 传送 的 参数 。 
实现 
如 果实 现 的 信号 数目 少 于 一 个 整 型 量 所 包含 的 位 数 ， 则 可 用 一 位 代 
表 一 个 信号 的 方法 实现 信号 集 。 例 如 ， 本 书 的 后 续 部 分 都 假定 一 种 实现 
有 31 种 信号 和 32 位 整 型 。sigemptyset 函 数 将 整 型 设置 为 0， sigfillset ek ži 
则 将 整 型 中 的 各 位 都 设置 为 1。 这 两 个 函数 可 以 在 <signal.h> 头 文件 中 实 
WAZ: 
#define sigemptyset(ptr) (*(ptr) = 0) 
#define sigfillset(ptr) (*(ptr) = ~(sigset_t)0, 0) 












































注意 ， 除 了 设置 信号 集中 各 位 为 1 外 ，sigfillset 必 须 返 回 0， 所 以 使 
用 C 语 言 的 逗号 算 从 ， 它 将 逗号 算 符 后 的 值 作为 表达 式 的 值 返 回 。 

使 用 这 种 实现 ，sigaddset 开启 一 位 (将 该 位 设置 为 1) sigdelset 
则 关闭 一 位 《〈 将 该 位 设置 为 0) ; sigismember 测 试 一 个 指定 的 位 。 因 为 
没有 信号 编写 为 0， 所 以 从 信号 编写 中 减 1 以 得 到 要 处 理 位 的 位 编写 数 。 
图 10-12 给 出 了 这 些 函 数 的 实现 。 








#include <signal.h> 
#include <errno.h> 


/* 

* <signal.h> usually defines NSIG to include signal number 0. 
uF 

#define SIGBAD(signo) ((signo) <= 0 || (signo) >= NSIG) 


int 
sigaddset (sigset_t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return (-1); 
} 
*set |= 1 << (signo - 1); /* turn bit on */ 
return (0); 


int 
sigdelset (sigset_t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return (-1); 
} 
*set &= ~(1 << (signo = 1)); /* turn bit off */ 
return (0); 


int 
Sigismember (const sigset_t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 


return (-1); 


| 


return((*set & (1 << (signo - 1))) != 0); 


图 10-12 sigaddset、sigdelset 和 sigismember 的 实现 
也 可 将 这 3 个 函数 在 <signal.h> 中 实现 为 各 一 行 的 宏 ， 但 是 POSIX.1 
要 求 检查 信号 编写 参数 的 有 效 性 ， 如 果 无 效 则 设置 errmmo。 在 宏 中 实现 这 
一 点 比 函 数 要 难 。 








10.12 efi 2{sigprocmask 


10.8 节 曾 提 及 一 个 进程 的 信号 屏蔽 字 规 定 了 当前 阻塞 而 不 能 递送 给 
该 进程 的 信号 集 。 调 用 函数 sigprocmask 可 以 检测 或 更 改 ， 或 同时 进行 检 
测 和 更 改进 程 的 信号 屏蔽 字 。 

#include <signal.h> 

int sigprocmask(int how, const sigset_t *restrict set, sigset_t *restrict 


oset); 
返回 值 : ERI, Eo; 吞 出错 ， 返 回 -1 
首先 ， 若 oset 是 非 空 指针 ， 那 么 进程 的 当前 信号 屏蔽 字 通 过 oset 返 
回 。 
其 次 ， 若 set 是 一 个 非 空 指针 ， 则 参数 how 指 示 如 何 修改 当前 信号 屏 
蔽 字 。 图 10-13 说 明了 how 可 选 的 值 。SIG_BLOCK 是 或 操作 ， 而 
SIG_SETMASK 则 是 赋值 操作 。 注 意 ， 不 能 阻塞 SIGKILL 和 SIGSTOP 信 














SIG BLOCK 议 进 程 新 的 信号 屏 项 字 SEMNE, set 包含 了 项 


SIG UNBLOCK 该 进程 新 了 KE SEAE, set E 











SIG SETMASK AEE eS HERE set RE 





图 10-13 用 sigprocmask 更 改 当 前 信号 屏蔽 字 的 方法 

如 果 set 是 个 空 指 针 ， 则 不 改变 该 进程 的 信号 屏蔽 字 ，how 的 值 也 无 
oe 

在 调用 sigprocmask 后 如 来 有 任何 未 决 的 、 不 再 阻 窟 的 信和 号， 则 在 
sigprocmask 返 回 前 ， 至 少将 其 中 之 一 递送 给 该 进程 。 

sigprocmask 是 仅 为 单线 程 进程 定义 的 。 处 理 多 线程 进程 中 信和 号 的 

ae 函数 。 我 们 将 在 12.8 节 中 对 此 进行 讨论 。 
SEB 














图 10-14 程 序 是 一 个 函数 ， 它 打印 调用 进程 信号 屏蔽 字 中 的 信和 号 
名 。 图 10-20 中 的 程序 和 图 10-22 中 的 程序 将 调用 此 函数 。 


tinclude "apue.h" 
#include <errno.h> 


void 


pr mask (const char *str) 


sigset_t  sigset; 
int errno save; 


errno save = errno; /* we can be called by signal handlers */ 
if (sigprocmask(0, NULL, &sigset) < 0) { 
err ret ("sigprocmask error"); 
} else | 
printf ("%s", str); 
if (Sigismember(&sigset, SIGINT) ) 
printf (" SIGINT"); 
if (sigismember(&sigset, SIGQUIT)) 
printf (" SIGQUIT"); 
if (sigismember (&sigset, SIGUSR1) ) 
printf (" SIGUSRL") ; 
if (sigismember(&sigset, SIGALRM) ) 
printf (" SIGALRM") ; 





/* remaining signals can go here */ 


printf ("\n"); 


errno = errno save; /* restore errno */ 


图 10-14 为 进程 打印 信号 屏蔽 字 
为 了 节省 空间 ， 没 有 对 图 10-1 中 列 出 的 每 一 种 信号 测试 该 屏蔽 字 





(见习 题 10.9) 。 


10.13 Pi 2{sigpending 


sigpending 函 数 返 回 一 信号 集 ， 对 于 调用 进程 而 言 ， 其 中 的 各 信和 号 
征 阻 赛 不 能 递送 的 ， 因 而 也 一 定 是 当前 未 决 的 。 该 信号 集 通 过 set 参 数 返 
回 。 





#include <signal.h> 
int sigpending(sigset_t *set); 

返回 值 : ERJ, REO 知 出 错 ， 返 回 -1 
实例 


图 10-15 展 示 了 很 多 前 面 说 明 过 的 信号 功能 。 





tinclude "apue,h" 

static void sig quit (int); 
int 

main (void) 

| 


Sigset_t newmask, oldmask, pendmask; 


if (signal (SIGQUIT, sig_quit) == SIG ERR) 


err_sys("can't catch SIGQUIT"); 


/* 
* Block SIGQUIT and save current signal mask. 
+y 
sigemptyset (&newmask) ; 
sigaddset ({newmask, SIGQUIT); 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err sys ("SIG BLOCK error"); 


sleep (5); /* SIGQUIT here will remain pending */ 


if (sigpending(&pendmask) < 0) 
err_sys("sigpending error"); 

if (sigismember (&pendmask, SIGQUIT)) 
printf ("\nSIGQUIT pending\n"); 


/* 
* Restore signal mask which unblocks SIGQUIT. 
K 
if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err_sys("SIG_SETMASK error"); 
printf ("SIGQUIT unblocked\n"); 


sleep(5); /* SIGQUIT here will terminate with core file */ 
exit (0); 


static void 
sig_quit (int signo) 
{ 
printf ("caught SIGQUIT\n") ; 
if (signal (SIGQUIT, SIG DFL) == SIG ERR) 
err_sys ("can't reset SIGQUIT"); 


图 10-15 信号 设置 和 sigprocmask 实 例 

进程 阻 寨 SIGQUIT 信 和 号， 保存 了 当前 信号 屏蔽 字 以便 以 后 恢 
复 ) ， 然 后 休眠 5 秒 。 在 此 期 间 所 产生 的 退出 信号 SIGQUIT 都 被 阻塞 ， 
不 递送 至 该 进程 ， 直 到 该 信号 不 再 被 阻塞 。 在 5 秒 休眠 结束 后 ， 检 查 该 
信号 是 否 是 未 决 的 ， 然 后 将 SIGQUIT 设 置 为 不 再 阻塞 。 

注意 ， 在 设置 SIGQUIT 为 阻塞 时 ， 我 们 保存 了 老 的 屏蔽 字 。 为 了 
解除 对 该 信号 的 阻塞 ， 用 老 的 屏蔽 字 重 新 设置 了 进程 信号 屏蔽 字 
(SIG_SETMASK) 。 男 一 种 方法 是 用 SIG_UNBLOCK 使 阻塞 的 信号 不 
再 阻塞 。 但 是 ， 应 当 了 解 如 果 编 写 一 个 可 能 由 其 他 人 使 用 的 函数 ， 而 且 
需要 在 函数 中 阻塞 一 个 信号 ， 则 不 能 用 SIG_UNBLOCK 简 单 地 解除 对 此 
信号 的 阻塞 ， 这 是 因为 此 函数 的 调用 者 在 调用 本 函数 之 前 可 能 也 阻塞 了 
此 信号 。 在 这 种 情况 下 必须 使 用 SIG_SETMASK 将 信号 屏蔽 字 恢 复 为 先 
n es ee 号 。10.18 节 的 System 函数 部 分 有 这 样 
J= T 

在 休眠 期 间 如 果 产 生 了 退出 信和 号， 那么 此 时 该 信号 是 未 决 的 ， 但 是 
不 再 受阻 塞 ， 所 以 在 sigprocmask 返回 之 前 ， 它 被 递送 到 调用 进程 。 从 
程序 的 输出 中 可 以 看 到 这 一 点 : SIGQUIT ” 处 理 程序 〈sig_quit) 中 的 
printf 语 句 先 执行 ， 然 后 再 执行 sigprocmask 之 后 的 printf 语 句 。 

然后 该 进程 再 休眠 5 秒 。 如 果 在 此 期 间 再 产生 退出 信号 ， 那 么 因为 
在 上 次 捕捉 到 该 信号 时 ， 己 将 其 处 理 方式 设置 为 默认 动作 ， 所 以 这 一 次 
它 就 会 使 该 进程 终止 。 在 下 列 输出 中 ， 当 我 们 在 终端 键入 退出 字符 
Ctrl 时 ， 终 端 打印 从 (终端 退出 字符 ) : 




















$ ./a.out 

N 产生 信号 一 次 (在 5s 之 内 ) 
SIGQUIT pending 从 sleep 返 回 后 
caught SIGQUIT 在 信号 处 理 程序 中 
SIGQUIT unblocked 从 sigprocmask 返 回 后 
NQuit(coredump) 再 次 产生 信和 号 

$ ./a.out 

AWAWAWAWWWWAWAA 产生 信号 10 次 (在 5 s 之 内 ) 
SIGQUIT pending 

caught SIGQUIT 只 产生 信和 号 一 次 
SIGQUIT unblocked 

A\Quit(coredump) 再 产生 信和 号 





shell 发 现 其 子 进 程 异 名 终止 时 输出 QUIT(coredump) 信 息 。 注 意 ， 第 
二 次 运行 该 程序 时 ， 在 进程 休眠 期 间 使 SIGQUIT 信 号 产生 了 10 次 ， 但 是 
解除 了 对 该 信号 的 阻塞 后 ， 只 回 进 程 传送 一 次 SIGQUIT。 从 中 可 以 看 出 


在 此 系统 上 没有 将 信号 进行 排队 。 


10.14 质数 sigaction 


sigaction 函 数 的 功能 是 检查 或 修改 (或 检查 并 修改 ) 与 指定 信号 相 
关联 的 处 理 动作 。 此 函数 取代 了 UNIX 早 期 版 本 使 用 的 signal 函 数 。 在 本 
节 末 尾 用 sigaction 函 数 实现 了 signal。 

#include <signal.h> 

int sigaction(int signo, const struct sigaction *restrict act, 

struct sigaction *restrict oact); 
返回 值 : ARJ, Be; FE, el- 

其 中 ， 参 数 signo 是 要 检测 或 修改 其 具体 动作 的 信号 编号 。 寿 act 指 
针 非 空 ， 则 要 修改 其 动作 。 如 果 oact 指 针 非 空 ， 则 系统 经 由 oact 指 针 返 
回 该 信号 的 上 一 个 动作 。 此 函数 使 用 下 列 结构 : 

struct sigaction { 

void (*sa_handler)(int); /* addr of signal handler, */ 
/* or SIG_IGN, or SIG_DFL */ 








sigset_t sa_mask; /* additional signals to block */ 
int sa_flags; /* signal options, Figure 10.16 */ 
/* alternate handler */ 

void (*sa_sigaction)(int, siginfo_t *, void *); 


i 

当 更 改 信和 号 动作 时 ， 如 果 sa hander 字段 包含 一 个 信和 号 捕捉 函数 的 
地 址 (不 是 常量 SIG_IGN 或 SIG_DFL) ， 则 sa_mask 字 段 说 明了 一 个 信 
号 集 ， 在 调用 该 信号 捕捉 函数 之 前 ， 这 一 信号 集 要 加 到 进程 的 信号 屏蔽 
字 中 。 仅 当 从 信号 捕捉 函数 返回 时 再 将 进程 的 信号 屏蔽 字 恢 复 为 原先 
值 。 这 样 ， 在 调用 信号 处 理 程序 时 就 能 阻塞 某 些 信号 。 在 信号 处 理 程序 
被 调用 时 ， 操 作 系 统 建立 的 新 信号 屏蔽 字 包 括 正 被 递送 的 信号 。 因 此 保 
证 了 在 处 理 一 个 给 定 的 信号 时 ， 如 果 这 种 信号 再 次 发 生 ， 那 么 它 会 被 阻 
塞 到 对 前 一 个 信号 的 处 理 结束 为 止 。 回 忆 10.8 节 ， 若 同一 种 信号 多 次 发 
生 ， 通 常 并 不 将 它们 加 入 队列 ， 所 以 如 果 在 某 种 信号 被 阻塞 时 ， 它 发 生 
了 5 次 ， 那 么 对 这 种 信号 解除 阻塞 后 ， 其 信号 处 理 函 数 通 常 只 会 被 调用 
一 次 〈 上 一 个 例子 已 经 说 明了 这 种 特性 ) 。 

一 旦 对 给 定 的 信号 设置 了 一 个 动作 ， 那 么 在 调用 sigaction 显 式 地 改 
变 它 之 前 ， 该 设置 就 一 直 有 效 。 这 种 处 理 方式 与 早期 的 不 可 靠 信 号 机 制 
不 同 ， 符 合 POSIX.1 在 这 方面 的 要 求 。 











act 结 构 的 sa_flags 字 段 指定 对 信号 进行 处 理 的 各 个 选项 。 图 10-16 详 
细 列 出 了 这 些 选项 的 意义 。 若 该 标志 已 定义 在 基本 POSIX.1 标准 中 ， 那 
A SUS WEE”; 知 该 标志 定义 在 基本 POSIX.1 标 准 的 XSI 扩 展 中 ， 那 
么 该 列 包含 “XSI”。 








ee Linux Mac OS "i 
说 明 
3.2.0 X eee S 6.8 


rsa INTERRUPT | 由 此 信 “由 此 信号 中 断 的 系统 洞 用 不 自动 重启 
动 (XSI 对 于 sigaction 的 默认 处 理 方 
A). 详 见 10.5 节 

SA NOCLDSTOP | ° 若 signo fe SIGCHLD, 当 子 进程 停止 ( 作 
业 控制 )， 不 产生 此 信号 。 当 子 进程 终止 
时 ， 仍 旧 产 生 此 信号 〈 但 请 参阅 下 面 说 
明 的 SA NOCLDWAIT 选项 )。 若 已 设置 
此 标志 ， 则 当 停止 的 进程 继续 运行 时 ， 
作为 XSI 扩 展 ， 不 产生 SIGCHLD 信号 


SA NOCLDWAIT | * A signo 是 SIGCHLD， 则 当 调用 进程 
的 子 进程 终止 时 ， 不 创建 僵 死 进程 。 基 
调用 进程 随后 调用 wait， 则 阻塞 到 它 所 
有 子 进程 都 终止 ， 此 时 返回 -1，errno 
设置 为 ECHILD ( 见 10.7 节 ) 

SA NODEFER | ， 当 捕捉 到 此 信号 时 ， 在 执行 其 信号 捕 


捉 函 数 时 ， 系 统 不 自动 阻塞 此 信号 〈 除 
非 sa_mask 包括 了 此 信号 )。 注 意 ， 此 
种 类 型 的 操作 对 应 于 早期 的 不 可 靠 信号 
SA_ONSTACK 若 用 sigaltstack(2) 已 声明 了 一 个 
替换 栈 ， 则 此 信号 递送 给 蔡 换 栈 上 的 进程 
SA RESETHAND | ° 在 此 信号 捕捉 函数 的 入 口 处 ， 将 此 信号 
的 处 理 方式 重 置 为 SIG_DFL， 并 清除 
SRA_SIGINFO 标志 。 注 意 ， 此 种 类 型 的 信 
号 对 应 于 早期 的 不 可 靠 信和 号。 但是， 不 能 
自动 重 置 SIGILL 和 SIGTRAP 这 两 个 信 
号 的 配置 。 设 置 此 标志 使 sigaction 的 
行为 如 同 设置 了 SA NODEFER 标志 
SA_RESTART ， 由 此 信号 中 断 的 系统 调用 自动 重启 动 
(参见 10.5 节 ) 
SA_SIGINFO ， 此 选项 对 信号 处 理 程序 提供 了 附加 信 
i: 一 个 指 由 siginfo 结构 的 指针 以 及 
一 个 指向 进程 上 下 文 标识 符 的 指针 


























图 10-16 处 理 每 个 信号 的 可 选 标 志 (sa_flags) 

sa_sigaction 字 段 是 一 个 替代 的 信号 处 理 程序 ， 在 sigaction 结 构 中 使 
用 了 SA_SIGINFO 标 志 时 ， 使 用 该 信号 处 理 程序 。 对 于 sa_sigaction 字 段 
和 sa_handler 字 段 两 者 ， 实 现 可 能 使 用 同一 存储 区 ， 所 以 应 用 只 能 一 次 
使 用 这 两 个 字段 中 的 一 个 。 

通常 ， 按 下 列 方式 调用 信号 处 理 程序 : 

void handler(int signo); 

但 是 ， 如 果 设 置 了 SA_SIGINFO 标 志 ， 那 么 按 下 列 方式 调用 信号 处 
理 程 序 : 

void handler(int signo, siginfo_t *info, void *context); 

siginfo 结 构 包 含 了 信和 号 产生 原因 的 有 关 信 息 。 该 结构 的 大 致 样式 如 
下 所 示 。 符 合 POSIX.1 的 所 有 实现 必须 至 少 包括 si_signo 和 si_code 成 员 。 
另外 ， 符 合 XSI 的 实现 至 少 应 包含 下 列 字段 : 

struct siginfo { 








int si_signo; /* signal number */ 

int si_ermo; /* if nonzero, errno value from 
<ermo.h> */ 

int si_code; /* additional info (depends on signal) */ 

pid_t si_pid; /* sending process ID */ 

uid_t si_uid; /* sending process real user ID */ 

void *si_addr; /* address that caused the fault */ 

int si_status; /* exit value or signal number */ 


union sigval si_value; /* application-specific value */ 
/* possibly other fields also */ 

te 

sigval 联 合 包含 下 列 字 段 : 

int sival_int; 

void *sival_ptr; 

应 用 程序 在 递送 信号 时 ， 在 si_value.sival_int 中 传递 一 个 整 型 数 或 者 
在 si_value.sival_ptr 中 传递 一 个 指针 值 。 

图 10-17 示 出 了 对 于 各 种 信号 的 si_code 值 ， 这 些 信号 是 由 Single 
UNIX Specification 定 义 的 。 注 意 ， 实 现 可 定义 附加 的 代码 值 。 

苛 信 号 是 SIGCHLD， 则 将 设置 si_pid、si_status 和 si_uid 字 7 段 。 耕 信 
号 是 SIGBUS、SIGILL、SIGFPE 或 SIGSEGV， 则 si_addr 包 含 造成 故障 
的 根源 地 址 ， 该 地 址 可 能 并 不 准确 。si_errno 字 段 包 含 错误 编号 ， 它 对 
应 于 造成 信号 产生 的 条 件 ， 并 由 实现 定义 。 

信号 处 理 程 序 的 context 参 数 是 无 类 型 指针 ， 它 可 被 强制 类 型 转换 为 


ucontext_t 结 构 类 型 ， 该 结构 标识 信号 传递 时 进程 的 上 下 文 。 该 结构 至 
少 包含 下 列 字 段 : 


ucontext_t *uc_link; /* pointer to context resumed when */ 
sigset_t uc_sigmask; /* signals blocked when this context */ 
stack_t uc_stack; /* stack used by this context */ 


/* this context returns */ 

/* is active */ 

mcontext_t uc_mcontext; /* machine-specific representation of */ 
/* saved context */ 


uc_stack 字 段 描述 了 当前 上 下 文 使 用 的 栈 ， 至 少 包 括 下 列 成 员 : 


void *ss_sp; /* stack base or pointer */ 
size_t SSs_Size; /* stack size */ 
int ss_flags; /* flags */ 





当 实 现 支持 实时 信号 扩展 时 ， 用 SA_SIGINFO 标 志 建 立 的 信号 处 理 
程序 将 造成 信号 可 靠 地 排队 。 一 些 保留 信号 可 由 实时 应 用 使 用 。 如 果 信 
号 由 sigqueue 函 数 产 生 ， 那 么 siginfo 结 构 能 包含 应 用 特有 的 数据 (参见 
10.207) 。 

实例 : signal ek žr 

现在 用 sigaction 实 现 signal 函 数 。 很 多 平台 都 是 这 样 做 的 〈POSIX.1 
的 基础 阐述 部 分 也 说 明 这 是 POSIX 所 希望 的 ) 。 另 一 方面 ， 有 些 系统 支 
持 老 的 不 可 靠 信 号 语义 signal 函 数 ， 其 目的 是 实现 二 进 制 癌 后 兼容 。 除 
非特 殊 地 要 求 老 的 不 可 靠 语 义 〈 为 了 回 后 兼容 ) ， 否 则 应 当 使 用 下 面 的 
signal 实现， 或 者 直接 调用 sigaction 〈 可 以 在 调用 sigaction 时 指定 
SA_RESETHAND 和 SA_NODEFER 选 项 以 实现 老 语义 的 signal 函 数 ) 。 
本 书 中 所 有 调用 signal 的 实例 均 调 用 图 10-18 中 实现 的 函数 。 





ILL_ILLOPC 非法 操作 码 
ILL ILLOPN 非法 操作 数 
ILL_ILLADR 非法 地 址 模式 
ILL_ILLTRP 非法 陷入 
ILL PRVOPC 特权 操作 码 
ILL PRVREG 特权 寄存 器 
ILL_COPROC 协 处 理 器 出 错 
ILL_BADSTK 内 部 栈 出 错 
FPE_INTDIV 整数 除 以 0 
FPE_INTOVF 整数 洲 出 

FPE FLTDIV 浮 点 除 以 0 
FPE_FLTOVF AE H 
FPE_FLTUND FF FAIA] F i E 
FPE_FLTRES 浮 点 不 精确 结果 
FPE_FLTINV 无 效 浮 点 操作 
FPE_FLTSUB 下 标 超 出 范围 


SIGILL 


SIGFPE 


SEGV_ACCERR 对 于 映射 对 象 的 无 效 权限 
BUS_ADRALN 无 效 地 址 对 齐 
SIGBUS BUS_ADRERR 不 存在 的 物理 地 址 


BUS OBJERR 对 象 特定 硬件 错 


ee TRAP _BRKPT 进程 断 点 陷入 
TRAP TRACE 进程 跟踪 陷入 


CLD EXITED 子 进程 已 终止 
CLD KILLED 子 进程 已 异常 终止 (无 core) 
Po CLD DUMPED 子 进程 已 异常 终止 (有 core) 
CLD_TRAPPED 被 跟踪 子 进程 已 陷入 
CLD_STOPPED 子 进程 已 停止 
CLD_CONTINUED 停止 的 子 进程 已 继续 
SI_USER kill 发 送 的 信号 
SI_QUEUE sigqueue 发 送 的 信号 
Any SI_TIMER timer_settime 设置 的 定时 器 超时 (实时 扩展 ) 
SI_ASYNCIO 异步 VO 请 求 完成 (实时 扩展 ) 
SI_MESGO 一 条 消息 到 达 消 息 队 列 《 实 时 扩展 ) 





图 10-17 siginfo_t 代 码 值 


村 nclude "apue.h" 


/* Reliable version of signal(), using POSIX sigaction(), */ 
Sigfunc * 

signal(int signo, Sigfunc *func) 

| 


struct sigaction act, oact; 


act.sa handler = func; 
sigemptyset (&act, sa mask); 
act ,sa flags = 0; 
if (signo == SIGALRM) { 
tifdef SA INTERRUPT 
act.sa_flags |= SA INTERRUPT; 
tendif 
} else | 
act.sa_flags |= SA RESTART; 
if (sigaction(signo, &act, goact) < 0) 
return (SIG ERR) ; 
return(oact.sa_handler) ; 


图 10-18 用 sigaction 实 现 的 signal 函 数 
注意 ， 必 须 用 sigemptyset 函 数 初 始 化 act 结 构 的 sa_mask 成 员 。 不 能 
保证 act.sa_mask=0 会 做 同样 的 事情 。 
对 除 SIGALRM 以 外 的 所 有 信和 号， 我 们 都 有 意 答 试 设置 


SA_RESTART 标 志 ， 于 是 被 这 些 信 号 中 断 的 系统 调用 都 能 自动 重启 
动 。 不 希望 重启 动 由 SIGALRM 信号 中 断 的 系统 调用 的 原因 是 : 我 们 希 
望 对 IO 操作 可 以 设置 时 间 限 制 〈 请 回忆 有 关 图 10-10 的 讨论 ) 。 

某 些 早期 系统 (如 SunOS) 定义 了 SA_INTERRUPT 标 志 。 这 些 系统 
的 默认 方式 是 重新 启动 被 中 断 的 系统 调用 ， 而 指定 此 标志 则 使 系统 调用 
被 中 断后 不 再 重启 动 。Linux 定 义 SA_INTERRUPT 标 志 ， 以 便 与 使 用 该 
标志 的 应 用 程序 兼容 。 但 是 ， 如 阁 信 号 处 理 程序 是 用 sigaction 设 置 的 ， 
那么 其 默认 方式 是 不 重新 启动 系统 调用 。Single UNIX Specification 的 
XSI 扩 展 规 定 ， 除 非 说 明了 SA_RESTART 标 志 ， 和 否则 sigaction 函 数 不 再 
重启 动 被 中 断 的 系统 调用 。 

实例 : signal_intr 函 数 

图 10-19 给 出 的 是 signal 函 数 的 男 一 种 版 本 ， 它 力图 阻止 被 中 断 的 系 
统 调用 重启 动 。 








tinclude "apue.h" 


Sigfunc * 
signal_intr(int signo, Sigfunc *func) 
| 


struct sigaction act, oact; 


act.sa handler = func; 
sigemptyset (&act. sa mask); 
act.sa_flags = 0; 
fifdef SA INTERRUPT 
ct ,Sa flags |= SA INTERRUPT; 
fendif 
if (sigaction(signo, fact, &oact) < 0) 
return (SIG ERR) ; 
return (oact.sa_handler) ; 





图 10-19 signal_intr 函 数 
如 果 系 统 定 义 了 SA_INTERRUPT 标 志 ， 那 么 为 了 提高 可 移植 性 ， 
我 们 在 sa_flags 中 增加 该 标志 ， 这 样 也 束 阻 止 了 被 中 断 的 系统 调用 的 重 


启动 。 





7.10 节 说 明了 用 于 非 局 部 转移 的 setjmp 和 longjmp 函数 。 在 信和 号 处 
而 不 是 从 该 
处 理 程序 返回 。 图 10-8 和 图 10-11 中 已 经 出 现 了 这 种 情况 。 

但 是 ， 调 用 longjmp 有 一 个 问题 。 当 捕捉 到 一 个 信号 时 ， 进 入 信号 
捕捉 函数 ， 此 时 当前 信号 被 自动 地 加 到 进程 的 信号 屏 珊 字 中 。 这 阻止 了 
后 来 产生 的 这 种 信号 中 断 该 信号 处 理 程序 。 如 采用 longjmp 跳 出 信号 处 
理 程 序 ， 那 么 ， 对 此 进程 的 信号 屏蔽 字 会 发 生 什 么 呢 ? 

在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ，setjmp 和 longjmp 保 存 和 恢复 
fas Bei. (Axe, Linux 3.2.0 和 Solaris 10 并 不 执行 这 种 操作 ， 虽 然 
Linux 支 持 提供 BSD 行 为 的 选项 。FreeBSD 8.0 和 Mac OS X 10.6.8 提 供 函 
数 _setjmp 和 _longjmp， 它 们 也 不 保存 和 恢复 信号 屏蔽 字 。 

为 了 允许 两 种 形式 并 存 ，POSIX.1 并 没有 指定 setjmp 和 ]ongjmp 对 信 

屏蔽 字 的 作用 ， 而 是 定义 了 两 个 新 函数 sigsetjmp 和 和 siglongjmp。 在 信 
号 处 理 程序 中 进行 非 局 部 转移 时 应 当 使 用 这 两 个 函数 。 

#include <setjmp.h> 

int sigsetjmp(sigjmp_buf env, int savemask); 

返回 值 : 知 直 接 调用 ， 返 回 0; 知 从 siglongjmp 调 用 返回 ， 则 返回 非 0 

void siglongjmp(sigjmp_buf env, int val); 

这 两 个 函数 和 setimp. longjmp 之 间 的 唯一 区 别 是 sigsetjmp 增加 了 
一 个 参数 。 如 果 savemask 非 0， 则 sigsetjmp 在 env 中 保存 进程 的 当前 信号 
屏蔽 字 。 调 用 siglongjmp 时 ， 如 果 带 非 0 savemask 的 sigsetjmp 调 用 已 经 保 
T i | 则 siglongjmp 从 其 中 恢复 保存 的 信号 屏蔽 字 。 

KH 

图 10-20 中 的 程序 演示 了 在 信号 处 理 程序 被 调用 时 ， 系 统 所 设置 的 
言 写 屏蔽 字 如 何 上 自动 地 包括 刚 被 捕捉 到 的 信 写 。 此 程序 也 示例 说 明了 如 
{ry (2 FA sigsetjmp Fil sighongjmp eA 2 © 

















finclude "apue.h" 
finclude <setjmp.h> 
finclude <time.h> 


static void sig_usrl (int); 
static void $ig_alrm(int) ; 
static sigjmp buf jmpbuf; 


static volatile sig atomic t canjump; 


int 
main(void) 
| 
if (signal (SIGUSR1, sig usrl) == SIG ERR) 
err sys("signal(SIGUSR1) error"); 


if (signal (SIGALRM, sig alrm) == SIG_ERR) 
err_sys("signal(SIGALRM) error"); 


pr mask ("starting main: "); /* Figure 10.14 */ 
if (sigsetjmp(jmpbuf, 1)) { 
pr_mask("ending main: "); 
exit (0); 
} 
canjump = 1; /* now sigsetjmp() is OK */ 
for (7; ) 


pause (); 


static void 
sig_usrl(int signo) 
{ 


time t starttime; 


if (canjump == 0) 
return; /* unexpected signal, ignore */ 


pr_mask("starting sig_usrl: "); 


alarm(3); /* SIGALRM in 3 seconds */ 
starttime = time (NULL); 
for (prè) /* busy wait for 5 seconds */ 
if (time(NULL) > starttime + 5) 
break; 


pr_mask("finishing sig usrl: "); 


canjump = 0; 
siglongjmp(jmpbuf, 1);/* jump back to main, don't return */ 


static void 
sig_alrm(int signo) 
{ 


pr_mask("in sig_alrm: "); 





图 10-20 信号 屏蔽 、sigsetjmp 和 siglongjmp 实 例 

此 程序 演示 了 男 一 种 技术 ， 只 要 在 信号 处 理 程 序 中 调用 siglongjmp 
就 应 使 用 这 种 技术 。 仅 在 调用 sigsetjmp 之 后 才 将 变量 canjump 设 置 为 非 0 
值 。 在 信号 处 理 程序 中 检测 此 变量 ， 仅 当 它 为 非 0 值 时 才 调 用 
siglongjmp。 这 提供 了 一 种 保护 机 制 ， 使 得 在 jmpbuf COLA) 尚未 
由 sigsetjmp 初始 化 时 ， 防 止 调用 信号 处 理 程序 。 (在 本 程序 中 ， 
siglongjmp 之 后 程序 很 快 就 结束 ， 但 是 在 较 大 的 程序 中 ， 在 siglongjmp 
之 后 的 较 长 一 段 时 间 内 ， 信 号 处 理 程序 可 能 仍旧 被 设置 ) 。 在 一 般 的 C 
代码 中 《不 是 信号 处 理 程序 ) ， 对 于 longjmp 并 不 需要 这 种 保护 措施 。 
但 是 ， 因 为 信号 可 能 在 任何 时 候 发 生 ， 所 以 在 信号 处 理 程序 中 ， 需 要 这 
种 保护 措施 。 

在 程序 中 使 用 了 数据 类 型 sig_atomic_t， 这 是 由 ISO C 标 准 定义 的 变 
量 类 型 ， 在 写 这 种 类 型 变量 时 不 会 被 中 断 。 这 意味 着 在 具有 虚拟 存储 器 
的 系统 上 ， 这 种 变量 不 会 跨越 页 边界 ， 可 以 用 一 条 机 器 指令 对 其 进行 访 
问 。 这 种 类 型 的 变量 总 是 包括 ISO 类 型 修饰 符 volatile， 其 原因 是 : 该 变 
量 将 由 两 个 不 同 的 控制 线程 一 main ”函数 和 异步 执行 的 信号 处 理 程序 
访问 。 图 10-21 显 示 了 此 程序 的 执行 时 间 顺 序 。 可 将 图 10-21 分 成 三 部 
分 : 左面 部 分 〈 对 应 于 main) ， 中 间 部 分 Csig_usr1) 和 右面 部 分 
(sig_alrm) 。 在 进程 执行 左面 部 分 时 ， 信 号 屏蔽 字 是 ”0 没有 信和 号 是 
阻塞 的 ) 。 而 执行 中 间 部 分 时 ， 其 信号 屏蔽 字 是 SIGUSR1。 执 行 右面 部 
分 时 ， 信 号 屏蔽 字 是 SIGUSR1 | SIGALRM. 



































signal() 
signal() 
r_mask() 
sigsetjmp() 
pause() 


SIGUSR1 递送 T siguri | 


pr mask() 
alarm() 
time( ) 
time( ) 
time ( ) 


+ saan | 





pr_mask( ) 
——S— a retun() 
从 信号 处 理 程序 中 返回 
| 
pr mask( ) 
sigsetjmp() «<——_ siglongjmp() 
pr mask() 
exit() 
图 10-21 处 理 两 个 信号 的 实例 程序 的 时 间 顺 序 
执行 图 10-20 程 序 ， 得 到 下 面 的 输出 : 
$ ./a.out & 在 后 台 启 动 进程 
starting main: 
[1] 531 作业 控制 shell 打 印 其 进程 
ID 
$ kill -USR1 531 [A] WERE RISSIGUSRI1 


starting sig_usrl: SIGUSR1 


$ in sig_alrm: SIGUSR1 SIGALRM 


finishing sig_usr1: SIGUSR1 


ending main: 
键入 回 车 

[1] + Done /a.out & 

该 输出 与 我 们 所 期 望 的 相同 : 当 调 用 一 个 信号 处 理 程 序 时 ， 被 捕捉 
到 的 信号 加 到 进程 的 当前 信号 屏蔽 字 中 。 当 从 信号 处 理 程序 返回 时 ， 恢 
复原 来 的 屏蔽 字 。 另 外 ，siglongjmp 恢复 了 由 sigsetjimp 所 保存 的 信号 屏 
HZ 


如 果 在 Linux 中 将 图 10-20 程 序 中 的 sigsetjmp 和 siglongjmp 分 别 蔡 换 成 
setjmp 和 longjmp 《在 FreeBSD 中 ， 则 奉 换 成 _setjmp 和 _longjmp) ， 则 最 
后 一 行 输出 变 成 : 

ending main: SIGUSR1 

这 意味 着 在 调用 setjmp 之 后 执行 main 函数 时 ， 其 SIGUSR1 是 阻塞 
的 。 这 多 半 不 是 我 们 所 希望 的 。 








10.16 Pi 2sigsuspend 


上 面 已 经 说 明 ， 更 改进 程 的 信号 屏蔽 字 可 以 阻 故 所 选择 的 信号 ， 或 
解除 对 它们 的 阻塞 。 使 用 这 种 技术 可 以 保护 不 希望 由 信号 中 断 的 代码 临 
界 区 。 如 采 和 希望 对 一 个 信号 解除 阻塞 ， 然 后 pause 以 等 待 以 前 被 阻塞 的 
信号 发 生 ， 则 又 将 如 何 呢 ? 假定 信号 是 SIGINT， 实 现 这 一 点 的 一 种 不 
正确 的 方法 是 : 

sigset_t newmask, oldmask; 

sigemptyset(&newmask); 

sigaddset(&newmask, SIGINT); 

/* block SIGINT and save current signal mask */ 

if (sigprocmask(SIG_BLOCK, &newmask, &oldmask) < 0) 

err_sys("SIG_BLOCK error"); 

/* critical region of code */ 

/* restore signal mask, which unblocks SIGINT */ 

if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 

err_sys("SIG_SETMASK error"); 

/* window is open */ 

pause(); /* wait for signal to occur */ 

/* continue processing */ 

如 果 在 信号 阻 压 时 ， 产 生 了 信和 号， 那么 该 信号 的 传递 就 被 推迟 直到 
对 它 解 除了 阻 时 。 对 应 用 程序 而 言 ， 该 信号 好 像 发 生 在 解除 对 SIGINT 
的 阻塞 和 pause 之 间 《 取 决 于 内 核 如 何 实现 信号 ) 。 如 果 发 生 了 这 种 情 
况 ， 或 者 如 果 在 解除 阻塞 时 刻 和 pause 之 间 确 实 发 生 了 信号 ， 那 么 就 会 
产生 问题 。 因 为 可 能 不 会 再 见 到 该 信号 ， 所 以 从 这 种 意义 上 讲 ， 在 此 时 
间 窗 口中 发 生 的 信号 丢失 了 ， 这 样 就 使 得 pause 永 远 阻 塞 。 这 是 早期 的 
不 可 徘 信 写 机 制 的 男 一 个 问题 。 

为 了 纠正 此 问题 ， 需 要 在 一 个 原子 操作 中 和 驳 恢 复 信号 屏蔽 字 ， 然 后 
使 进程 休眠 。 这 种 功能 是 由 sigsuspend 函 数 所 提供 的 。 

#include <signal.h> 

int sigsuspend(const sigset_t *sigmask); 

返回 值 : -1， 并 将 errno 设 置 为 EINTR. 
进程 的 信号 屏蔽 字 设 置 为 由 sigmask 指 向 的 值 。 在 捕捉 到 一 个 信号 
或 发 生 了 一 个 会 终止 该 进程 的 信号 之 前 ， 该 进程 被 挂 起 。 如 果 捕 捉 到 一 








个 信和 号 而 且 从 该 信号 处 理 程序 返回 ， 则 sigsuspend 返 回 ， 并 且 访 进程 的 
信号 屏蔽 字 设 置 为 调用 sigsuspend 之 前 的 值 。 

注意 ， 此 函数 没有 成 功 返回 值 。 如 果 它 返回 到 调用 者 ， 则 总 是 返回 
-1， 并 将 ermo 设置 为 EINTR (表示 一 个 被 中 断 的 系统 调用 ) 。 

实例 
图 10-22 显 示 了 保护 代码 临界 区 ， 使 其 不 被 特定 信号 中 断 的 正确 方 
法 。 


finclude "apue hn 
static void sig_int (int); 
int 


main (void) 


| 


sigset_t newmask, oldmask, waitmask; 


pr_mask("program start: "); 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err_sys("signal(SIGINT) error"); 

sigemptyset (&waitmask) ; 

sigaddset (&waitmask, SIGUSR1) ; 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGINT); 


/* 
* Block SIGINT and save current signal mask. 
*/ 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG_BLOCK error"); 


/* 
* Critical region of code. 
| 


pr_mask("in critical region: "); 


/* 
* Pause, allowing all signals except SIGUSR1. 
i 

if (sigsuspend(&waitmask) != -1) 


err_sys("sigsuspend error"); 


pr_mask ("after return from sigsuspend: "); 
/* 
* Reset signal mask which unblocks SIGINT. 
a 


if (sigprocmask(SIG_SETMASK, &o0ldmask, NULL) < 0) 
err_sys ("SIG SETMASK error"); 


/* 
* And continue processing . 
ai 

pr_mask ("program exit: "); 


exit (0); 


static void 
sig_int (int signo) 
{ 


pr_mask("\nin sig_int: "); 





图 10-22 保护 临界 区 不 被 信号 中 断 

注意 ， 当 sigsuspend 返 回 时 ， 它 将 信号 屏蔽 字 设 置 为 调用 它 之 前 的 
值 。 在 本 例 中 ，SIGINT 信 和 号 将 被 阻塞 。 因 此 将 信号 屏蔽 恢复 为 之 前 保 
存 的 值 Coldmask) 。 

运行 图 10-22 中 的 程序 得 到 下 面 的 输出 : 

$ ./a.out 

program start: 

in critical region: SIGINT 

AC 键入 中 断 字符 

in sig_int: SIGINT SIGUSR1 

after return from sigsuspend: SIGINT 

program exit: 

在 调用 sigsuspend 时 ， 将 SIGUSRI 信 和 号 加 到 了 进程 信号 屏蔽 字 中 ， 
所 以 当 运 行 该 信号 处 理 程序 时 ， 我 们 得 知 信号 屏蔽 字 已 经 改变 了 。 从 中 
可 见 ， 1 sigsuspend 返回 时 ， 它 将 信号 屏蔽 字 恢 复 为 调用 它 之 前 的 值 。 

SKH 

sigsuspend 的 另 一 种 应 用 是 等 待 一 个 信号 处 理 程 序 设 置 一 个 全 局 变 
量 。 图 10-23 中 的 程序 用 于 捕 换 中 断 信号 和 退出 信号 ， 但 是 希望 仅 当 捕 
欣 到 退出 信号 时 ， 才 唤醒 主 例 程 。 





























#include "apue.h" 


volatile sig_atomic_t quitflag; /* set nonzero by signal handler */ 


static void 
sig_int (int signo) /* one signal handler for SIGINT and SIGQUIT */ 
{ 
if (signo == SIGINT) 
printf ("\ninterrupt\n") ; 
else if (signo == SIGQUIT) 
quitflag = 1; /* set flag for main loop */ 


int 
main (void) 
{ 


sigset_t newmask, oldmask, zeromask; 


if (signal (SIGINT, sig_int) == SIG ERR) 
err_sys("signal (SIGINT) error"); 

if (signal (SIGQUIT, sig_int) == SIG_ERR) 
err_sys("signal(SIGQUIT) error"); 


sigemptyset (&zeromask) ; 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGQUIT); 


/* 
* Block SIGQUIT and save current signal mask. 
w 
if (sigprocmask(SIG_BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG BLOCK error"); 


while (quitflag == 0) 
sigsuspend (&zeromask) ; 


/* 


* SIGQUIT has been caught and is now blocked; do whatever. 
ji 
quitflag = 0; 


/+ 
* Reset signal mask which unblocks SIGQUIT. 
ji 
if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err sys("SIG_SETMASK error"); 














exit (0); 
| 
图 10-23 用 sigsuspend 等 待 一 个 全 局 变量 被 设置 
此 程序 的 样本 输出 是 : 
$ ./a.out 
AC 键入 中 断 字符 
interrupt 
AC 再 次 键入 中 断 字 符 
interrupt 
AC 再 一 次 
interrupt 
N$ 用 退出 符 终止 


考虑 到 支持 ISO ”CC 的 非 POSIX 系 统 与 POSIX 系 统 两 者 之 间 的 可 移植 
性 ， 在 一 个 信号 处 理 程序 中 唯一 应 当做 的 是 为 sig_atomic_t 类 型 的 变量 赋 
一 个 值 。POSIX.1 规 定 得 更 多 一 些 ， 它 详细 说 明了 在 一 个 信号 处 理 程序 
中 可 以 安全 地 调用 的 函数 列表 〔( 见 图 10-4) ， 但 是 如 果 这 样 来 编写 代 
De 

实例 

可 以 用 信号 实现 父 、 子 进程 之 间 的 同步 ， 这 是 信号 应 用 的 另 一 个 实 
例 。 图 10-24 ”给 出 了 8.9 节 中 提 到 的 5 个 例 程 的 实现 ， 它 们 是 
TELLWAIT、 TELL PARENT、 TELL CHILD、WAIT_PARENT 和 
WAIT_CHILD. 








finclude "apue.h" 


static volatile sig atomic t sigflag; /* set nonzero by sig handler */ 
static sigset_t newmask, oldmask, zeromask; 


static void 
sig usr(int signo)  /* one signal handler for SIGUSR1 and SIGUSR2 */ 
| 

sigflag = 1; 


void 
TELL WAIT (void) 
| 
if (signal (SIGUSR1, sig usr) == SIG ERR) 
err sys("signal (SIGUSR1) error"); 


if (signal (SIGUSR2, sig usr) == SIG ERR) 
err_sys("signal(SIGUSR2) error"); 

sigemptyset (&zeromask) ; 

sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGUSR1) ; 

sigaddset (&énewmask, SIGUSR2) ; 


/* Block SIGUSR1 and SIGUSR2, and save current signal mask */ 
if (sigprocmask(SIG_BLOCK, &newmask, &oldmask) < 0) 
err_sys("SIG_BLOCK error"); 


void 
TELL PARENT (pid t pid) 
{ 
kill (pid, SIGUSR2) ; /* tell parent we're done */ 


void 
WAIT PARENT (void) 
{ 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for parent */ 
sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err_sys("SIG_SETMASK error"); 


void 
TELL CHILD (pid t pid) 
{ 
kill (pid, SIGUSR1); /* tell child we're done */ 


void 
WAIT CHILD (void) 
{ 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for child */ 
sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err sys ("SIG SETMASK error"); 





图 10-24 父子 进程 可 用 来 实现 同步 的 例 程 

其 中 使 用 了 两 个 用 户 定 义 的 信号 : SIGUSR1 由 父 进程 发 送 给 子 进 
程 ，SIGUSR2 由 子 进程 发 送 给 父 进程 。 图 15-7 显 示 了 使 用 管道 的 这 5 个 
函数 的 另 一 种 实现 。 

如 果 在 等 待 信号 发 生 时 希望 去 休眠 ， 则 使 用 sigsuspend 函数 是 非常 
适当 的 《正如 在 前 面 两 个 例子 中 所 示 ) ， 但 是 如 果 在 等 待 信号 期 间 和 希望 
调用 其 他 系统 函数 ， 那 么 将 会 怎样 呢 ? 遗憾 的 是 ， 在 单线 程 环境 下 对 此 
问题 没有 妥善 的 解决 方法 。 如 果 可 以 使 用 多 线程 ， 则 可 专门 安排 一 个 线 
程 处 理 信 号 〈 见 12.8 节 中 的 讨论 ) 。 

如 果 不 使 用 线程 ， 那 么 我 们 能 尽力 做 到 最 好 的 是 ， 当 信和 号 发 生 时 ， 
在 信号 捕捉 程序 中 对 一 个 全 局 变量 置 1。 例 如 ， 若 我 们 捕捉 SIGINT 和 
SIGALRM 这 两 种 信号 ， 并 用 signal_intr 函 数 设 置 这 两 个 信号 的 处 理 程 
序 ， 使 得 它们 中 断 任 一 被 阻塞 的 慢 速 系统 调用 。 当 进程 阻塞 在 调用 read 
函数 等 待 慢 速 设备 输入 时 ， 很 可 能 发 生 这 两 种 信号 〈 如 果 设 置 闹钟 以 阻 
止 永远 等 待 输入 ， 那 么 对 于 SIGALRM 信 号 ， 这 种 情况 尤其 会 发 生 ) 。 
处 理 这 种 问题 的 代码 类 似 于 下 面 所 示 : 
































if (intr_flag) /* flag set by our SIGINT handler */ 
handle_intr(); 
if (alrm flag) /* flag set by our SIGALRM handler */ 


handle_alrm(); 
/* signals occurring in here are lost */ 
while (read( ... ) < 0) { 
if (errno == EINTR) { 
if (alrm_flag) 
handle_alrm(Q); 
else if (intr_flag) 
handle_intr(); 
} else { 
/* some other error */ 
} 
} else if (n == 0) { 
/* end of file */ 
} else { 
/* process input */ 


} 
在 调用 read 之 前 测试 各 全 局 标志 ， 如 果 read 返 回 一 个 中 断 的 系统 调 
用 错误 ， 则 再 次 进行 测试 。 如 果 在 前 两 个 让 语句 和 后 随 的 read 调用 之 间 





捕捉 到 两 个 信号 中 的 任意 一 个 ， 则 问题 束 发 生 了 。 正 如 代码 中 的 注释 所 
出 的 ， 在 此 处 发 生 的 信号 丢失 了 。 调 用 信号 处 理 程序 ， 它 们 设置 了 相 
应 的 全 局 变量 ， 但 是 read 决 不 会 返回 (除非 某 些 数 据 已 准备 好 可 读 ) 。 

我 们 希望 实现 下 列 操 作 步 又 。 

(1) 阻塞 SIGINT 和 SIGALRM。 

(2) 测试 两 个 全 局 变量 以 判别 是 否 发 生 了 一 个 信号 ， 如 果 已 发 生 
则 对 此 进行 处 理 。 

(3) 调用 read (或 任何 其 他 系统 函数 ) 并 解除 对 这 两 个 信号 的 阻 
塞 ， 这 两 个 操作 应 当 是 一 个 原子 操作 。 

M4 (3) 步 是 pause 操 作 时 ，sigsuspend 函 数 才能 帮助 我 们 。 





10.17 K 2 abort 


前 面 已 提 及 abort 函 数 的 功能 是 使 程序 异 各 终止 。 

#include <stdlib.h> 

void abort(void); 

此 函数 不 返回 值 

此 函数 将 SIGABRT 信 号 发 送 给 调用 进程 (进程 不 应 忽略 此 信 
号 ) o ISO  ”C 规 定 ， 调 用 abort 将 问 主 机 环境 递送 一 个 未 成 功 终止 的 通 
知 ， 其 方法 是 调用 raise(SIGABRT) 函 数 。 

ISO C 要 求 藻 捕捉 到 此 信号 而 且 相 应 信号 处 理 程序 返回 ，abort 仍 不 
会 返回 到 其 调用 者 。 如 果 捕 捉 到 此 信号 ， 则 信号 处 理 程序 不 能 返回 的 唯 
一 方法 是 它 调 用 exit、_exit、_Exit、longjmp 或 siglongjmp 〈10.15 节 讨论 
了 longjmp 和 siglongjmp 之 间 的 区 别 ) 。POSIX.1 也 说 明 abort 并 不 理会 进 
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让 进程 捕捉 SIGABRT 的 意图 是 : 在 进程 终止 之 前 由 其 执行 所 需 的 
清理 操作 。 如 果 进 程 并 不 在 信号 处 理 程序 中 终止 自己 ，POSIX.1 声 明 当 
信号 处 理 程序 返回 时 ，abort 终 止 该 进程 。 

ISO _C 针 对 此 函数 的 规范 将 下 列 问 题 留 由 实现 决定 : 是 否 要 冲洗 输 
出 流 以 及 是 否 要 删除 临时 文件 〈 见 5.13 节 ) 。 POSIX.1 的 要 求 则 更 进 一 
步 ， 它 要 求 如 果 abort 调 用 终止 进程 ， 则 它 对 所 有 打开 标准 WO 流 的 效果 
应 当 与 进程 终止 前 对 每 个 流 调用 fclose 相 同 。 

System V 的 早期 版 本 中 ，abort 函 数 产 生 SIGIOT 信 号。 更 进一步 ， 
进程 忽略 此 信号 或 者 捕捉 它 并 从 信号 处 理 程序 返回 ， 这 都 是 可 能 的 ， 在 
返回 情况 下 ，abort 返 回 到 它 的 调用 者 。 

4.3BSD 产 生 SIGILL 信 号 。 在 此 之 前 ， 该 函数 解除 对 此 信号 的 阻 
塞 ， 将 其 配置 恢复 为 SIG_DFL (终止 并 创建 core 文 件 ) 。 这 阻止 一 个 进 
程 忽 略 或 捕捉 此 信号 。 

历史 上 ，abort 的 各 种 实现 在 如 何 处 理 标准 IO 流 方面 是 并 不 相同 
的 。 对 于 保护 性 的 程序 设计 以 及 为 提高 可 移植 性 ， 如 果 和 希望 冲洗 标准 
IO 流 ， 则 在 调用 abort 之 前 要 执行 这 种 操作 。 在 err_dump 函 数 中 实现 了 
这 一 点 〈 见 附录 B) 。 

因为 大 多 数 UNIX 系 统 tmnpfile〈 临 时 文件 ) 的 实现 在 创建 该 文件 之 
a ee 所 以 ISO C 关 于 临时 文件 的 警告 通常 与 我 们 无 关 。 

实例 











图 10-25 中 的 abort 函 数 是 按 POSIX.1 说 明 实 现 的 。 


#include <signal.h> 
tinclude <stdio.h> 
tinclude <stdlib.h> 
finclude <unistd.h> 





void 
abort (void) /* POSIX-style abort() function */ 
| 

sigset_t mask; 

struct sigaction action; 


/* Caller can't ignore SIGABRT, if so reset to default */ 
sigaction(SIGABRT, NULL, action); 
if (action.sa handler == SIG IGN) | 
action. sa handler = SIG DFL; 
sigaction (SIGABRT, &action, NULL); 
} 
if (action.sa handler == SIG DFL) 
fflush (NULL) ; /* flush all open stdio streams */ 


/* Caller can't block SIGABRT; make sure it's unblocked */ 
sigfillset (&mask) ; 
sigdelset (mask, SIGABRT); /* mask has only SIGABRT turned off */ 


Sigprocmask (SIG SETMASK, &mask, NULL); 
kill (getpid(), SIGABRT); /* send the signal */ 


/* If we're here, process caught SIGABRT and returned */ 





fflush (NULL) ; /* flush all open stdio streams */ 
action.sa handler = SIG DFL; 

sigaction(SIGABRT, faction, NULL); /* reset to default */ 
sigprocmask (SIG SETMASK, &mask, NULL); /* just in case... */ 
kill (getpid(), SIGABRT) ; /* and one more time */ 


exit(1); /* this should never be executed ,,, */ 


图 10-25 abort 的 POSIX.1 实 现 

自 先 查看 是 否 将 执行 默认 动作 ， 硅 是 则 冲洗 所 有 标准 WO 流 。 这 并 
不 等 价 于 对 所 有 打开 的 流 调用 fclose〈 因 为 只 冲洗 ， 并 不 关闭 它们 ) ， 
但 是 当 进 程 终 止 时 ， 系 统 会 关闭 所 有 打开 的 文件 。 如 果 进 程 捕捉 此 信和 号 
并 返回 ， 那 么 因为 进程 可 能 产生 了 更 多 的 输出 ， 所 以 再 一 次 冲洗 所 有 的 
流 。 不 进行 冲洗 处 理 的 唯一 条 件 是 如 果 进 程 捕捉 此 信和 号， 然后 调用 _exit 
或 _ Exit。 在 这 种 情况 下 ， 任 何 未 冲洗 的 内 存 中 的 标准 IO 缓存 都 被 丢 
我 们 假定 捕捉 此 信号 ， 而 且 _exit 或 _Exit 的 调用 者 并 不 想 要 冲洗 缓冲 
Xo 

回忆 10.9 节 ， 如 果 调 用 kill 使 其 为 调用 者 产生 信和 号， 并 且 如 果 该 信和 号 
是 不 被 阻 窜 的 (图 10-25 中 的 程序 保证 做 到 这 一 点 )， 则 在 kl 返回 前 该 
信号 〈 或 某 个 未 决 、 未 阻塞 的 信号 ) 就 被 传送 给 了 该 进程 。 我 们 阻塞 除 
SIGABRT 外 的 所 有 信号 ， 这 样 就 可 知 如 果 对 kil 的 调用 返回 了 ， 则 该 进 
程 一 定 已 捕捉 到 该 信号 ， 并 且 也 从 该 信号 处 理 程序 返回 








10.18 A system 


8.13 节 已 经 有 了 一 个 system 函 数 的 实现 ， 但 是 该 版 本 并 不 执行 任何 
信号 处 理 。POSIX.1 要 求 system 忽 略 SIGINT 和 SIGQUIT， 阻 塞 
SIGCHLD。 在 给 出 一 个 正确 地 处 理 这 些 信号 的 一 个 版 本 之 前 ， 先 说 明 
为 什么 要 考虑 信号 处 理 。 

实例 

图 10-26 中 的 程序 使 用 8.13 节 中 的 system 版 本 ， 用 其 调用 ed(1) 编 辑 
器 。 (ed 编辑 器 很 久 以 来 就 是 UNIX 的 组 成 部 分 。 在 这 里 使 用 它 的 原因 
fe: 它 是 捕捉 中 断 和 退出 信号 的 交互 式 程序 。 若 从 shell 调 用 ed， 并 键入 
中 断 字 符 ， 则 它 捕 捉 中 断 信 号 并 打印 问号 。ed 程 序 对 退出 信号 的 处 理 方 
式 设 置 为 忽略 。) 

图 10-26 中 的 程序 用 于 捕捉 SIGINT 和 SIGCHLD 信 号 。 若 调用 它 则 可 
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fF: 
$ ./a.out 
a 将 正文 退 加 至 编辑 器 缓冲 区 
Here is one line of text 
行 首 的 点 停止 退 加 方式 
1,$p 打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 便 
观察 其 内 容 
Here is one line of text 
w temp.foo 将 缓冲 区 写 至 一 文件 
25 编辑 器 称 写 了 25 个 字 节 
q 离开 编辑 器 
caught SIGCHLD 


当 编 辑 器 终止 时 ， 系 统 向 父 进程 〈a.outj 进 程 ) 发 送 SIGCHLD 信 
号 。 父 进程 捕捉 它 ， 执 行 其 处 理 程序 sig_chid， 然 后 从 信号 处 理 程序 返 
回 。 但 是 若 父 进程 正 捕捉 SIGCHLD 信号 (因为 它 创建 了 子 进程 ， 所 以 
应 当 这 样 做 以 便 了 解 它 的 子 进程 在 何 时 终止 ) ， 那 么 正在 执行 system 函 
数 时 ， 应 当 阻 寨 对 父 进 程 递 送 SIGCHLD 信 号 。 实 际 上 ， 这 就 是 POSIX.1 
所 说 明 的 。 人 否则 ， 当 system 创 建 的 子 进 程 结 束 时 ，system 的 调用 者 可 能 
昔 误 地 认为 ， 它 自己 的 一 个 子 进程 结束 了 。 于 是 ， 调 用 者 将 会 调用 一 种 
wait 函 数 以 获得 子 进程 的 终止 状态 ， 这 样 承 阻 止 了 system 函 数 获得 子 进 
程 的 终止 状态 ， 并 将 其 作为 它 的 返回 值 。 





finclude "apue ,hn 


static void 
sig_int (int signo) 
| 
printf ("caught SIGINT\n") ; 


static void 
sig chld(int signo) 
| 
printf ("caught SIGCHLD\n") ; 


int 
main (void) 


| 


if (signal (SIGINT, sig_int) == SIG ERR) 
err sys("signal (SIGINT) error"); 

if (signal (SIGCHLD, sig chld) == SIG ERR) 
err_sys("signal (SIGCHLD) error"); 


if (system("/bin/ed") < 0) 


err sys("system() error"); 


exit (0); 





10-26 用 syetem 调 用 ed 编辑 器 
如 果 再 次 执行 该 程序 ， 在 这 次 运行 时 将 一 个 中 断 信号 传送 给 编辑 


Ay 则 可 得 : 





$ ./a.out 

a 将 正文 退 加 至 编辑 器 绥 冲 区 

hello, world 

行 首 的 点 停止 奶 加 方式 

1,$p fT ENA FEITE nT, DAE 
其 内 容 

hello, world 

w temp.foo 将 缓冲 区 写 至 一 文件 

13 编辑 器 称 写 了 13 个 字 节 

AC 键入 中 断 符 

? 编辑 器 捕捉 信号 ， 打 印 问号 

caught SIGINT 父 进程 执行 同一 操作 

q 离开 编辑 器 

caught SIGCHLD 


回忆 9.6 节 可 知 ， 键 入 中 断 字 符 可 使 中 断 信号 传送 给 前 合 进程 组 中 
的 所 有 进程 。 图 10-27 展 示 了 编辑 器 正在 运行 时 的 各 个 进程 的 关系 。 


/bin/sh 


L J 
后 台 进 程 组 前 台 进 程 组 














图 10-27 图 10-26 程 序 运 行 时 的 前 人 台 和 后 台 进 程 组 

在 这 一 实例 中 ，SIGINT 被 送 给 3 个 前 台 进 程 (shell 进 程 忽略 此 信 
号 ) 。 从 输出 中 可 见 ，a.out 进 程 和 ed 进程 捕捉 该 信号 。 但 是 ， 当 用 
System 运行 另 一 个 程序 时 ， 不 应 使 父 、 子 进程 两 者 都 捕 提 终端 产生 的 两 
个 信号 : 中 断 和 退出 。 这 两 个 信号 只 应 发 送 给 正在 运行 的 程序 : 子 进 
程 。 因 为 由 system 执 行 的 命令 可 能 是 交互 式 命 令 〈 如 本 例 中 的 ed) ， 以 
及 因为 system 的 调用 者 在 程序 执行 时 放弃 了 控制 ， 等 待 该 执行 程序 的 结 
束 ， 所 以 system 的 调用 者 就 不 应 接收 这 两 个 终端 产生 的 信号 。 这 束 是 为 
什么 POSIX.1 规 定 system 的 调用 者 在 等 待命 令 完 成 时 应 当 忽略 这 两 个 信 
号 的 原因 。 

实例 

人 

号 处 理 。 




















#include <sys/wait.h> 
#include <errno.h> 
#include <signal.h> 
#include <unistd.h> 


int 
system(const char *cmdstring) /* with appropriate signal handling */ 
{ 

pid t pid; 

int status; 


struct sigaction ignore, saveintr, savequit; 
sigset_t chldmask, savemask; 


if (cmdstring == NULL) 
return (1); /* always a command processor with UNIX */ 


ignore,sa handler = SIG_IGN;  /* ignore SIGINT and SIGQUIT */ 
sigemptyset (&ignore.sa_mask) ; 
ignore.sa flags = 0; 
if (sigaction(SIGINT, &ignore, &saveintr) < 0) 
return (-1); 
if (sigaction(SIGQUIT, Signore, &savequit) < 0) 
return (-1); 
sigemptyset (&chldmask) ; /* now block SIGCHLD */ 
sigaddset (&chldmask, SIGCHLD); 
if (sigprocmask(SIG BLOCK, &chldmask, &savemask) < 0) 
return (-1); 





if ((pid = fork()) < 0) { 
status = -1; /* probably out of processes */ 

} else if (pid == 0) { /* child */ 
/* restore previous signal actions & reset signal mask */ 
sigaction(SIGINT, &saveintr, NULL); 


sigaction(SIGQUIT, &savequit, NULL); 
sigprocmask (SIG SETMASK, &savemask, NULL); 


exec] ("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
exit (127); /* exec error */ 
} else | /* parent */ 
while (waitpid(pid, &status, 0) < 0) 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


/* restore previous signal actions & reset signal mask */ 
if (sigaction(SIGINT, &saveintr, NULL) < 0) 
return (-1) ; 
if (sigaction(SIGQUIT, &savequit, NULL) < 0) 
return(-1); 
if (sigprocmask (SIG SETMASK, &savemask, NULL) < 0) 
return(-1); 





return (status); 


图 10-28 system 函 数 的 POSIX.1 正 确实 现 
如 果 将 图 10-26 中 的 程序 与 system 函 数 的 这 一 实现 相 链接 ， 那 么 所 产 
生 的 二 进 制 代码 与 上 一 个 有 缺陷 的 程序 相 比 较 ， 存 在 如 下 差别 。 
(1) 当 我 们 键入 中 断 字符 或 退出 字符 时 ， 不 向 调用 进程 发 送信 


i 
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(2) 当 ed 命令 终止 时 ， 不 同调 用 进程 发 送 SIGCHLD 信号 。 作 为 
蔡 代 ， 在 程序 末尾 的 sigprocmask 调用 对 SIGCHLD 信和 号 解除 阻塞 之 前 ， 
SIGCHLD 信号 一 直 被 阻塞 。 而 对 sigprocmask 函 数 的 这 一 次 调用 是 在 
system 函数 调用 waitpid 获 取 子 进程 的 终止 状态 之 后 。 

POSIX.1 说 明 ， 在 SIGCHLD 未 决 期 间 ， 如 知 wait 或 waitpid 返 回 了 子 
进程 的 状态 ， 那 么 SIGCHLD 信 和 号 不 应 递送 给 该 父 进 程 ， 除 非 另 一 个 子 
进程 的 状态 也 可 用 。FreeBSD 8.0、Mac OS X 10.6.8 和 Solaris 10 都 实现 
了 这 种 语义 ， 而 Linux ”3.2.0 没 有 实现 这 种 语义 ， 在 system 函 数 调用 了 
waitpid Ja, SIGCHLD 保持 为 未 决 ， 当 解除 了 对 此 信号 的 阻 压 后 ， 它 被 
递送 至 调用 者 。 如 果 我 们 在 图 10-26 的 sig_chld 函 数 中 调用 wait，Linux 系 
统 将 返回 -1， 并 将 errmo 设 置 为 ECHILD， 因 为 system 消 数 已 取 到 子 进程 
的 终止 状态 。 

很 多 较 早 的 书 中 使 用 下 列 程序 段 ， 它 忽略 中 断 和 退出 信号 : 

if ( (pid = fork()) < 0){ 

err_sys("fork error"); 
}else if (pid == 0) { 

/* child */ 

execl(...); 

_exit(127); 

| 

/* parent */ 

old_intr = signal(SIGINT, SIG_IGN); 

old_quit = signal(SIGQUIT, SIG_IGN); 

waitpid(pid, &status, 0) 

signal(SIGINT, old_intr); 

signal(SIGQUIT, old_quit); 

这 段 代 码 的 问题 是 ， 在 forkk 之 后 不 能 保证 父 进程 还 是 子 进程 先 运 
行 。 如 果子 进程 先 运 行 ， 父 进程 在 一 段 时 间 后 再 运行 ， 那 么 在 父 进程 将 
中 渐 信 号 的 处 理 更 改 为 忽略 之 前 ， 束 可 能 产生 这 种 信号 。 由 于 这 种 原 
因 ， 图 10-28 中 在 fork 之 前 就 改变 对 该 信号 的 配置 。 

注意 ， 子 进程 在 调用 execl 之 前 要 驳 恢 复 这 两 个 信号 的 处 理 。 如 同 
8.10 节 中 所 说 明 的 一 样 ， 这 就 允许 在 调用 者 配置 的 基础 上 ，exedl 可 将 它 
们 的 配置 更 改 为 默认 值 。 

system 的 返回 值 

注意 system 的 返回 值 ， 它 是 shell 的 终止 状态 ， 但 shell 的 终止 状态 并 
不 已 是 执行 命令 字符 串 进 程 的 终止 状态 。 图 8-23 中 有 一 些 例子 ， 其 结果 
正 是 我 们 所 期 望 的 。 如 采 执 行 一 条 如 date 那 样 的 简单 命令 ， 其 终止 状态 














是 0。 
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131 





执行 shell 命 令 exit 44， 则 得 终止 状态 44。 在 信号 方面 又 如 何 呢 ? 
运行 图 8-24 程 序 ， 并 加 正在 执行 的 命令 发 送 一 些 信 和 号: 
$ tsys "sleep 30" 
ACnormal termination, exit status = 130 键入 中 断 符 
$tsys "sleep 30" 
A\sh: 946 Quit 键入 退出 符 
normal termination, exit status = 131 
当 用 中 断 信号 终止 Sleep 时 ，pr_exit 函 数 〈 见 图 8-5) 认为 它 正 常 终 
当 用 退出 符 杀 死 sleep 进 程 时 ， 会 发 生 同 样 的 事情 。 终 止 状态 130、 








又 是 怎样 得 到 的 呢 ? 原来 Bourne shell 有 一 个 在 其 文档 中 没有 说 清楚 





的 特性 ， 其 终止 状态 是 128 加 上 一 个 信号 编号， 该 信号 终止 了 正在 执行 
的 命令 。 用 交互 方式 使 用 shell 可 以 看 到 这 一 点 。 


$ sh 确保 运行 Bourne shell 

$ sh -c "sleep 30" 

AC 键入 中 断 符 

$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
130 


$sh -c "sleep 30" 
A\sh: 962 Quit - core dumped 键入 退出 符 


$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
131 
$ exit 离开 Bourne shell 


在 所 使 用 的 系统 中 ，SIGINT 的 值 为 2，SIGQUIT 的 值 为 9， 于 是 给 


出 shell 终 止 状态 130、131。 


再 试 一 个 类 似 的 例子 ， 这 一 次 将 一 个 信号 直接 送 给 shell， 然 后 观察 


system 返 回 什 么 : 
$ tsys "sleep 30" & 这 一 次 在 后 台 启 动 它 
9257 
$ ps -f 查看 进程 ID 


UID PID PPID TTY TIME CMD 
sar 9260 949 pts/5 0:00 ps -f 
sar 9258 9257 pts/5 0:00 sh -c sleep 30 
sar 949 947 pts/5 0:01 /bin/sh 
sar 9257 949 pts/5 0:00 tsys sleep 30 
sar 9259 9258 pts/5 0:00 sleep 30 
$ kill -KILL 9258 杀 死 shell 自 身 
abnormal termination, signal number = 9 从 中 可 见 ， 仅 当 Sshell 本 身 异 


党 终止 时 ，system 的 返回 值 才 报告 一 个 异常 终止 。 

其 他 的 shell 在 处 理 终端 产生 的 信号 (如 SIGINT 和 SIGQUIT》〉 时 表现 
出 来 的 行为 各 不 相同 。 例 如 在 bash 和 dash 中 ， 键 入 中 断 或 退出 符 会 导致 
市 有 对 应 信号 编写 的 表示 异常 终止 的 退出 状态 。 但 是 ， 如 果 发 现 正在 执 
行 sleep 的 进程 并 直接 给 它 发 送信 号 ， 这 样 信号 只 会 到 达 单 个 进程 而 不 是 
整个 前 台 进 程 组 。 这 些 shell 与 Bourne shell 类似， 以 正常 终止 状态 128 加 
上 信号 编号 退出 。 

在 编写 使 用 system 函 数 的 程序 时 ， 一 定 要 正确 地 解释 返回 值 。 如 果 
直接 调用 fork、exec 和 wait， 则 终止 状态 与 调用 system 是 不 同 的 。 





10.19 K 2vsleep. nanosleep fi! 


clock_nanosleep 


在 本 书 的 很 多 例子 中 都 已 使 用 了 sheep 函 数 ， 在 图 10-7 程 序 和 图 10-8 
程序 中 有 两 个 sleep 的 实现 ， 但 它们 都 是 有 缺陷 的 。 

#include <unistd.h> 

unsigned int sleep(unsigned int seconds); 

返回 值 : 0 或 未 休眠 完 的 秒 数 

此 函数 使 调用 进程 被 挂 起 直到 满足 下 面 两 个 条 件 之 一 。 

(1) 已 经 过 了 seconds 所 指定 的 墙 上 时 钟 时 间 。 

(2) 调用 进程 捕捉 到 一 个 信号 并 从 信和 号 处 理 程序 返回 。 

a 
|e 民 一 些 。 

在 第 1 种 情形 ， 返 回 值 是 0。 当 由 于 捕捉 到 某 个 信号 Sleep 提早 返回 时 
ne 
眠 时 间 ) 。 

尽管 Sleep 可 以 用 alarm 函 数 〈 见 10.10 节 ) 实现 ， 但 这 并 不 是 必需 
的 。 如 果 使 用 alarm， 则 这 两 个 函数 之 间 可 能 相互 影响 。POSIX.1 标准 对 
这 些 相互 影响 并 未 做 任何 说 明 。 例 如 ， 若 先 调用 alarm(10)， 过 了 3 秒 后 
又 调用 sleep(5)， 那 么 将 如 何 呢 ?sleep 将 在 5 秒 后 返回 (假定 在 这 上 段 时 间 
内 没有 捕捉 到 男 一 个 信号 ) ， 但 是 否 在 2 秒 后 义 产 生男 一 个 SIGALRM 信 
写 呢 ?此 细节 与 具体 实现 有 关 。 

FreeBSD 8.0、Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10 用 nanosleep 
冰 数 实现 sleep， 使 sleep 具 体 实 现 与 信号 和 闸 钟 定时 器 相互 独立 。 考 虑 到 
可 移植 性 ， 不 应 对 sleep 的 实现 进行 任何 假定 ， 但 是 如 果 混 合 调用 sleep 和 
A a 

Sc pl 

图 10-29 给 出 的 是 一 个 POSIX.1 sleep 函 数 的 实现 。 此 函数 是 图 10-7 程 
序 的 修改 版 ， 它 可 靠 地 处 理 信 号 ， 避 免 了 早期 实现 中 的 竞争 条 件 ， 但 是 
仍 未 处 理 与 以 前 设置 的 闹钟 的 交互 作用 《正如 前 面 提 到 的 ，POSIX.1 并 
未 显 式 地 对 这 些 交 互 进行 定义 ) 。 


























finclude "apue hn 


static void 
sig_alrm(int signo) 
| 


/* nothing to do, just returning wakes up sigsuspend() */ 


unsigned int 

sleep (unsigned int seconds) 

{ 
struct sigaction newact, oldact; 
sigset_t newmask, oldmask, suspmask; 
unsigned int unslept; 


/* set our handler, save previous information */ 
newact.sa_handler = sig alrm; 

sigemptyset (&newact.sa_mask) ; 

newact.sa_flags = 0; 

sigaction(SIGALRM, &newact, &oldact); 


/* block SIGALRM and save current signal mask */ 
sigemptyset (&newmask) ; 

sigaddset (&newmask, SIGALRM) ; 
sigprocmask (SIG BLOCK, &newmask, &oldmask) ; 


alarm(seconds) ; 
suspmask = oldmask; 


/* make sure SIGALRM isn't blocked */ 
sigdelset (&suspmask, SIGALRM) ; 


/* wait for any signal to be caught */ 
sigsuspend(&suspmask) ; 


/* some signal has been caught, SIGALRM is now blocked */ 
unslept = alarm(0); 


/* reset previous action */ 
sigaction(SIGALRM, &oldact, NULL); 


/* reset signal mask, which unblocks SIGALRM */ 
sigprocmask(SIG_SETMASK, &oldmask, NULL); 
return (unslept) ; 


图 10-29 sleep 的 可 靠 实 现 
与 图 10-7 相 比 ， 为 了 可 靠 地 实现 sleep， 图 10-29 的 代码 比较 长 。 程 
序 中 没有 使 用 任何 形式 的 非 局 部 转移 〈 如 图 10-8 中 为 了 避免 在 alarm 和 
pause 之 间 的 竞争 条 件 所 做 的 那样 ) ， 所 以 对 处 理 SIGALRM 信 号 期 间 可 
能 执行 的 其 他 信号 处 理 程序 没有 任何 影响 。 
nanosleep 函 数 与 Sleep 函数 类 似 ， 但 提供 了 纳 秒 级 的 精度 。 
#include <time.h> 
int nanosleep(const struct timespec *reqtp, struct timespec *remtp); 
返回 值 : ARRERA, GIO; Artis, e- 
这 个 函数 挂 起 调用 进程 ， 直 到 要 求 的 时 间 已 经 超时 或 者 某 个 信号 中 
呆 了 该 函数 。reqtp 参 数 用 秒 和 纳 秒 指定 了 需要 休眠 的 时 间 长 度 。 如 宁 茶 
个 信号 中 断 了 休眠 间隔 ， 进 程 并 没有 终止 ，remtp 人 参数 指向 的 timespec 
结构 就 会 被 设置 为 未 休眠 完 的 时 间 长 度 。 如 果 对 未 休眠 完 的 时 间 并 不 感 
兴趣 ， 可 以 把 该 参数 置 为 NULL。 
如 果 系 统 并 不 文 持 纳 秒 这 一 精度 ， 要 求 的 时 间 就 会 取 整 。 因 为 
nanosleep 函 数 并 不 涉及 产生 任何 信号 ， 所 以 不 需要 担心 与 其 他 函数 的 交 
Hs 











nanosleep 函 数 过 去 属于 Single UNIX Specification 的 定时 器 选项 ， 现 
已 被 移 至 SUSv4 的 基础 部 分 。 

随 着 多 个 系统 时 钟 的 引入 (回忆 6.10 节 ) ， 需 要 使 用 相对 于 特定 
时 钟 的 延迟 时 间 来 挂 起 调用 线程 。clock_nanosleep 函 anit | Hoh 
HE o 


#include <time.h> 
int clock_nanosleep(clockid_t clock_id, int flags, 
const struct timespec *reqtp, struct timespec *remtp); 
返回 值 : ARRERA Te), eo; Aree, JIRA 
clock_id 参 数 指定 了 计算 延迟 时 间 基 于 的 时 钟 。 时 钟 标 识 符 列 于 图 
6-8 中 。flags 参 数 用 于 控制 延迟 是 相对 的 还 是 绝对 的 。flags 为 0 时 表示 休 
虐 时 间 是 相对 的 〈 例 如， 希望 休 虐 的 时 间 长 度 )， 如 有 果 flags 值 设置 为 
TIMER_ABSTIME， 表 示 休 眠 时 间 是 绝对 的 《例如 ， 和 希望 休眠 到 时 钟 到 
达 菏 个 特定 的 时 间 ) 。 
其 他 的 参数 reqtp 和 remtp， 与 nanosleep 函 数 中 的 相同 。 但 是 ， 使 用 
绝对 时 间 时 ，remtp 参 数 未 使 用 ， 因 为 没有 必要 。 在 时 钟 到 达 指 定 的 绝 
时 间 值 以 前 ， 可 以 为 其 他 的 clock_nanosleep 调 用 复 用 reqtp 参 数 相同 的 


注意 ， 除 了 出 错 返 回 ， 调 用 
clock_nanosleep(CLOCK_REALTIME, 0, reqtp, remtp); 











和 调用 

nanosleep(reqtp, remtp); 

的 效果 是 相同 的 。 使 用 相对 休眠 的 问题 是 有 些 应 用 对 休眠 长 度 有 精 
度 要 求 ， 相 对 休眠 时 间 会 导致 实际 休眠 时 间 比 要 求 的 长 。 例 如 ， 某 个 应 
用 程序 希望 按 固 定 的 时 间 间 隔 执行 任务 ， 就 必须 获取 当前 时 间 ， 计 算 下 
次 执行 任务 的 时 间 ， 然 后 调用 nanosleep。 在 获取 当前 时 间 和 调用 
nanosleep 之 间 ， 处 理 器 调度 和 抢占 可 能 会 导致 相对 休眠 时 间 超 过 实际 需 
要 的 时 间 间 隔 。 即 便 分 时 进程 调度 程序 对 休眠 时 间 绪 束 后 是 人 否 会 马上 执 
行 用 户 任务 并 没有 给 出 保证 ， 使 用 绝对 时 间 还 是 改善 了 精度 。 

在 Single UNIX Specification 的 早期 版 本 中 ，clock_nanosleep 函 数 属 
于 时 钟 选择 选项 ， 在 SUSv4 中 ， 该 函数 已 移 至 基础 部 分 。 

















10.20 FÃ 2sigqueue 


在 10.8 节 中 ， 我 们 介绍 了 大 部 分 UNIX 系 统 不 对 信号 排队 。 在 
POSIX.1 的 实时 扩展 中 ， 有 些 系统 开始 增加 对 信号 排队 的 支持 。 在 
SUSv4 中 ， 排 队 信和 号 功能 已 从 实时 扩展 部 分 移 至 基础 说 明 部 分 。 

通常 一 个 信号 带 有 一 个 位 信息 : 信号 本 喘 。 除 了 对 信和 号 排队 以 外 ， 
这 些 扩展 允许 应 用 程序 在 递交 信号 时 传递 更 多 的 信息 (回忆 10.14 
W) 。 这 些 信息 租 入 在 siginfo 结 构 中 。 除 了 系统 提供 的 信息 ， 应 用 程序 
还 可 以 同 信 号 处 理 程序 传递 整数 或 者 指向 包含 更 多 信息 的 缓冲 区 指针 。 

使 用 排队 信号 必须 做 以 下 几 个 操作 。 

(1) 使 用 sigaction 函 数 安装 信号 处 理 程序 时 指定 SA_SIGINFO 标 
志 。 如 果 没 有 给 出 这 个 标志 ， 信 号 会 延迟 ， 但 信号 是 否 进 入 队列 要 取决 
于 具体 实现 。 

(2) 在 sigaction 结 构 的 sa_sigaction 成 员 中 而 不 是 通常 的 
sa_handler 字 段 〉 提 供 信 号 处 理 程序 。 实 现 可 能 允许 用 户 使 用 sa_handler 
字段 ， 但 不 能 获取 sigqueue 函 数 发 送出 来 的 额外 信息 。 

(3) 使 用 sigqueue 函 数 发 送信 号。 

#include <signal.h> 

int sigqueue(pid_t pid, int signo, const union sigval value); 

BEHE: ERJ, Wel; FRE, Re- 
sigqueue K žr R REI rR Sa SRE, nf ME value žE 
P 除 此 之 外 ，sigqueue 函 数 与 ki 函数 类 
以 。 

音 号 不 能 被 无 限 排队 。 回 忆 图 2-9 和 图 2-11 中 的 SIGQUEUE_MAX 限 
制 。 到 达 相 应 的 限制 以 后 ，sigqueue 就 会 失败 ， 将 errno 设 为 EAGAIN。 

随 着 实时 信号 的 增强 ， 引 入 了 用 于 应 用 程序 的 独立 信号 集 。 这 些 信 
号 的 编号 在 SIGRTMIN 一 SIGRTMAX 之 间 ， 包 括 这 两 个 限制 值 。 注 意 ， 
这 些 信号 的 默认 行为 是 终止 进程 。 

图 10-30 总 结 了 排队 信号 在 本 书 不 同 的 实现 中 的 行为 上 的 差异 。 

Mac OS X 10.6.8 并 不 支持 sigqueue 或 者 实时 信号 。 在 Solaris 10 中 ， 
sigqueue 在 实时 库 librt 中 。 














gir Linux MacOS — Solaris 
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ff sigqueue 
~ SIGRTMIN Al SIGRIMAX 之 外 的 信号 排队 
即使 调用 者 没 使 用 SA SIGINFO 标志 ， 也 对 信号 排队 | mi 


图 10-30 不 同 平台 上 排队 信号 的 行为 





10.21 作业 控制 信 筷 


在 图 10-1 所 示 的 信号 中 ，POSIX.1 认 为 有 以 下 6 个 与 作业 控制 有 关 。 

SIGCHLD 子 进程 已 停止 或 终止 。 

SIGCONT 如 果 进 程 已 停止 ， 则 使 其 继续 运行 。 

SIGSTOP 停止 信号 (不 能 被 捕捉 或 忽略 〉。 

SIGTSTP 交互 式 停 止 信号 。 

SIGTTIN 后 台 进 程 组 成 员 读 控制 终端 。 

SIGTTOU 后 台 进 程 组 成 员 写 控制 终端 。 

除 SIGCHLD 以 外 ， 大 多 数 应 用 程序 并 不 处 理 这 些 信号 ， 交 互 式 
shell 则 通常 会 处 理 这 些 信号 的 所 有 工作 。 当 键入 挂 起 字符 (通常 是 
Ctrl+Z) 时 ，SIGTSTP 被 送 至 前 台 进 程 组 的 所 有 进程 。 当 我 们 通知 shell 
在 前 台 或 后 台 恢 复 运 行 一 个 作业 时 ，shell 向 该 作业 中 的 所 有 进程 发 送 
SIGCONT 信 和 号。 与 此 类 似 ， 如 果 问 一 个 进程 递送 了 SIGTTIN 或 
SIGTTOU 信 号 ， 则 根据 系统 默认 的 方式 ， 停 止 此 进程 ， 作 业 控 制 shell 了 
解 到 这 一 点 后 就 通知 我 们 。 

一 个 例外 是 管理 终端 的 进程 ， 例 如 ，vi(1) 编 辑 器 。 当 用 户 要 挂 起 它 
时 ， 它 需要 能 了 解 到 这 一 点 ， 这 样 就 能 将 终端 状态 恢复 到 vi 启动 时 的 
情况 。 另 外 ， 当 在 前 台 恢 复 它 时 ， 它 需要 将 终端 状态 设置 回 它 所 希望 的 
状态 ， 并 需要 重新 绘制 终端 屏幕 。 可 以 在 下 面 的 例子 中 观察 到 与 vi 类 
似 的 程序 是 如 何 处 理 这 种 情况 的 。 

在 作业 控制 信号 间 有 某 些 交互 。 当 对 一 个 进程 产生 4 种 停止 信号 
(SIGTSTP、SIGSTOP、SIGTTIN 或 SIGTTOU) 中 的 任意 一 种 时 ， 对 该 
进程 的 任 一 未 决 SIGCONT 信 号 就 被 于 弃 。 与 此 类 似 ， 当 对 一 个 进程 产 
生 SIGCONT 信 号 时 ， 对 同一 进程 的 任 一 未 决 停止 信号 被 丢弃 。 

注意 ， 如 果 进 程 是 停止 的 ， 则 SIGCONT 的 默认 动作 是 继续 该 进 
fe; 否则 忽略 此 信号 。 通 常 ， 对 该 信号 无 需 做 任何 事情 。 当 对 一 个 停止 
的 进程 产生 一 个 SIGCONT 信号 时 ， 该 进程 就 继续 ， 即 使 该 信号 是 被 阻 
塞 或 忽略 的 也 是 如 此 。 

实例 

图 10-31 中 的 程序 演示 了 当 一 个 程序 处 理 作 业 控 制 时 通常 所 使 用 的 
规范 代码 序列 。 该 程序 只 是 将 其 标准 输入 复制 到 其 标准 输出 ， 而 在 信号 
处 理 程序 中 以 注释 形式 给 出 了 管理 屏幕 的 程序 所 执行 的 典型 操作 。 






































finclude "apue ,hn 


#define BUFFSIZE 1024 


static void 


sig_tstp(int signo) /* signal handler for SIGTSTP */ 


[ 


int 


sigset t mask; 
/* ... move cursor to lower left corner, reset tty mode... */ 
/* 
* Unblock SIGTSTP, since it's blocked while we're handling it. 
a 
sigemptyset (&mask) ; 
Sigaddset (&mask, SIGTSTP) ; 
Sigprocmask (SIG UNBLOCK, &mask, NULL); 
signal (SIGTSTP, SIG DFL); /* reset disposition to default */ 
kill (getpid(), SIGTSTP); /* and send the signal to ourself */ 
/* we won't return from the kill until we're continued */ 


signal (SIGTSTP, sig_tstp); /* reestablish signal handler */ 


/* ,,, reset tty mode, redraw screen ... */ 


main (void) 
| 
int nj 
char buf [BUFFSIZE] ; 


/* 
* Only catch SIGTSTP if we're running with a job-control shell, 
*/ 
if (signal (SIGISTP, SIG IGN) == SIG DFL) 
signal (SIGISTP, sig tstp); 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT FILENO, buf, n) != n) 


err_sys("write error"); 


if (n < 0) 


err_sys("read error"); 


exit(0); 




















图 10-31 如 何 处 理 SIGTSTP 

当 图 10-31 中 的 程序 启动 时 ， 仪 当 SIGTSTP 信 号 的 配置 是 
SIG_DFL， 它 才 安 排 捕捉 该 信号 。 其 理由 是 : 当 此 程序 由 不 支持 作业 控 
ill shell (如 /bin/sh) 启动 时 ， 此 信号 的 配置 应 当 设 置 为 SIG_IGN。 实 
际 上 ，shell 并 不 显 式 地 忽略 此 信号 ， 而 是 由 init 将 这 3 个 作业 控制 信号 
SIGTSTP、SIGTTIN 和 SIGTTOU 设 置 为 SIG_IGN。 然 后 ， 这 种 配置 由 所 
有 登录 shell 继 承 。 只 有 作业 控制 shell 才 应 将 这 3 个 信和 号 重新 设置 为 
SIG_DFL. 

当 键 入 挂 起 字符 时 ， 进 程 接 到 SIGTSTP 信号 ， 然 后 调用 该 信号 处 





理 程序 。 此 时 ， 应 当 进 行 与 终端 有 关 的 处 理 : 将 光标 移 到 左下 角 、 人 恢复 
终端 工作 方式 等 。 在 将 SIGTSTP 重 置 为 默认 值 〈 停 止 该 进程 ) ， 并 且 解 
除了 对 此 信号 的 阻塞 之 后 ， 进 程 癌 上 自己 发 送 同 一 信号 SIGTSTP。 因 为 正 
在 处 理 SIGTSTP 信号 ， 而 在 捕捉 该 信号 期 间 系 统 目 动 地 阻塞 它 ， 所 以 
应 当 解 除 对 此 信和 号 的 阻塞 。 到 达 这 一 点 时 ， 系 统 停 止 该 进程 。 仅 当 某 个 
进程 (通常 是 正 啊 应 一 个 交互 式 fg 命 令 的 作业 控制 shell〉 向 该 进程 发 送 
一 个 SIGCONT 信号 时 ， 该 进程 才 继 续 。 我 们 不 捕捉 SIGCONT 信号 。 
该 信号 的 默认 配置 是 继续 运行 停止 的 进程 ， 当 此 发 生 时 ， 此 程序 如 同 从 
kil 函数 返回 一 样 继续 运行 。 当 此 程序 继续 运行 时 ， 将 SIGTSTP 信 和 号 重 
置 为 捕捉 ， 并 且 做 我 们 所 希望 做 的 终端 处 理 〈 如 重新 绘制 屏幕 ) 。 








10.22 455 Énis 
本 节 介绍 如 何在 信号 编号 和 信号 名 之 间 进行 映射 。 某 些 系 统 提 供 数 











extern char *sys_siglist[]; 
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FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8 都 提供 这 种 信号 名 数 
组 。Solaris 10 也 提供 信号 名 数组 ， 但 该 数组 名 是 _sys_siglist。 

可 以 使 用 psignal 函 数 可 移植 地 打印 与 信号 编号 对 应 的 字符 串 。 

#include <signal.h> 

void psignal(int signo, const char *msg); 

字符 串 msg (通常 是 程序 名 ) 输 出 到 标准 错误 文件 ， 后 面 跟 随 一 
冒号 和 一 个 空格 ， 再 后 面 对 该 信号 的 说 明 ， 最 后 是 一 个 换行 待 。 如 果 
msg 为 NULL， 只 有 信和 号 说 明 部 分 输出 到 标准 错误 文件 ， 该 函数 类 似 于 
perror (1.773) 。 

和 如果 在 sigaction 信 号 处 理 程序 中 有 siginfo 结 构 ， 可 以 使 用 psiginfo 函 
数 打印 信号 信息 

#include signal be 

void psiginfo(const siginfo_t *info, const char *msg); 

它 的 工作 方式 与 psignal 函数 类 似 。 虽 然 这 个 函数 访问 除 信号 编号 
以 外 的 更 多 信息 ， 但 不 同 的 平台 输出 的 这 些 额外 信息 可 能 有 所 不 同 。 

如 有 果 只 需要 信号 的 字符 拉 述 部 分 ， 也 不 需要 把 它 写 到 标准 错误 文件 
中 《如 可 以 写 到 日 志文 件 中 ) ， 可 以 使 用 strsignal 函 数 ， 它 类 似 于 
strerror (59 1.775) 。 

#include <string.h> 

char *strsignal(int signo); 











返回 值 ， 指 辣 描述 该 信号 的 字符 串 的 指针 

给 出 一 个 信号 编号 ，strsignal 将 返回 描述 该 信号 的 字符 串 。 应 用 程 
序 可 用 该 字符 串 打 印 关 于 接收 到 信号 的 出 错 消息 。 

本 书 讨论 的 所 有 平台 都 提供 psignal 和 strsignal 函 数 ， 但 相互 之 间 有 
些 差 别 。 在 Solaris 10 中 ， 寿 信号 编号 无 效 ，strsignal 将 返回 一 个 空 指 
针 ， 而 FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8 则 返回 一 个 字符 串 ， 
它 指出 信号 编号 是 不 可 识别 的 。 

只 有 Linux 3.2.0 和 Solaris 10 文 持 psiginfo 函 数 。 














Solaris 提 供 一 对 函数 ， 一 个 函数 将 信号 编写 映 冉 为 信号 名 ， 男 一 个 
则 反之 。 

#include <signal.h> 

int sig2str(int signo, char *str); 

int str2sig(const char *str, int *signop); 

两 个 图 数 的 返回 值 : ARD, eo 在 出 错 ， 返 回 -1 

在 编写 交互 式 程序 ， 其 中 需 接 收 和 打印 信号 名 和 信号 编号 时 ， 这 两 
个 函数 是 有 用 的 。 

sig2str 国 数 将 给 定 信号 编号 翻译 成 字符 串 ， 并 将 结果 存放 在 str 指 加 
的 存储 区 。 调 用 者 必须 保证 该 存储 区 足够 大 ， 可 以 保存 最 长 字符 串 ， 包 
括 终止 null 字 节 。Solaris 在 <signal.h> 中 包含 了 常量 SIG2STR_MAX,， 它 
定义 了 最 大 字符 串 长 度 。 该 字符 串 包括 不 带 “SIG” 前 级 的 信号 名 。 例 
SIGKILL 被 翻译 为 字符 串 “KILL”， 并 存放 在 str 指 问 的 存储 缓冲 区 

















str2sig ”函数 将 给 出 的 信号 名 翻译 成 信号 编号 。 该 信号 编号 存放 在 
signop 指 癌 的 整 型 中 。 名 字 要 么 是 不 融 “SIG” 前 级 的 信号 名 ， 要 么 是 表示 
十 进 制 信号 编号 的 字符 串 (如 “9”) 。 

注意 ，sig2str 和 str2sig 与 常用 的 函数 做 法 不 同 ， 当 它们 失败 时 ， 并 


不 设置 errno。 








10.23 小 结 


言 写 用 于 大 多 数 复杂 的 应 用 程序 中 。 理 解 进行 信号 处 理 的 原因 和 方 
式 对 于 高 级 UNIX 编 程 极其 重要 。 本 间 对 UNIX 信 号 进行 了 详细 而 且 比 较 
深入 的 介绍 。 首 先 说 明了 早期 信号 实现 的 问题 以 及 它们 是 如 何 显现 出 来 
的 。 然 后 介绍 了 POSIX.1 的 可 靠 信 号 概念 以 及 所 有 相关 的 函数 。 在 此 基 
础 上 提供 了 abort、system 和 sleep 函 数 的 POSIX.1 实 现 。 最 后 以 观察 分 析 
作业 控制 信号 以 及 信号 名 和 信和 号 编号 之 间 的 转换 结 











10.1 删除 图 10-2 程 序 中 的 for(;;) 语 句 ， 结 果 会 怎样 ? 为 什么 ? 

10.2 实现 10.22 节 中 说 明 的 sig2str 函 数 。 

10.3 画 出 运行 图 10-9 程 序 时 的 栈 帧 情况 。 

10.4 图 10-11 程 序 中 利用 setjmp 和 longjmp 设 置 1/O 操 作 的 超时 ， 下 而 
的 代码 也 常见 用 于 此 种 目的 : 

signal(SIGALRM, sig_alrm); 

alarm(60); 

if (setjmp(env_alrm) != 0) { 

/* handle timeout */ 


} 


这 段 代 码 有 什么 错误 ? 

10.5 仅 使 用 一 个 定时 器 (alarm 或 较 高 精度 的 setitimer) ， 构 造 一 组 
函数 ， 使 得 进程 在 该 单一 定时 器 基础 上 可 以 设置 任 一 数量 的 定时 器 。 

10.6 编写 一 段 程序 测试 图 10-24 中 父 进 程 和 子 进 程 的 同步 函数 ， 要 
求 进程 创建 一 个 文件 并 癌 文 件 写 一 个 整数 0， 然 后 ， 进 程 调 用 fork， 接 
着 ， 父 进程 和 子 进程 交 杖 增加 文件 中 的 计数 器 值 ， 每 次 计数 器 值 增加 1 
时 ， 打 印 是 哪 一 个 进程 〈 子 进程 或 父 进程 ) 进行 了 该 增加 1 操作 。 

10.7 在 图 10-25 中 ， 若 调用 者 捕捉 了 SIGABRT 并 从 该 信号 处 理 程 序 
中 返回 ， 为 什么 不 是 仅仅 调用 _exit， 而 要 恢复 其 默认 设置 并 再 次 调用 
kill? 

10.8 为 什么 在 siginfo 结 构 〈 见 10.14 节 ) 的 si_uid 字 段 中 包括 实际 用 
户 ID 而 非 有 效用 户 ID? 

10.9 重 写 图 10-14 中 的 函数 ， 要 求 它 处 理 图 10-1 中 的 所 有 信和 号， 每 次 
循环 处 理 当 前 信号 屏蔽 字 中 的 一 个 信号 《〈 并 不 是 对 每 一 个 可 能 的 信号 都 
循环 一 次 ) 。 

10.10 ”编写 一 段 程 序 ， 要 求 在 一 个 无 限 循环 中 调用 sleep(60) 函 数 ， 
每 5 分 钟 〈 即 5 次 循环 ) 取 当 前 的 日 期 和 时 间 ， 并 打印 tm_sec 字 段 。 将 程 
序 执行 一 晚上 ， 请 解释 其 结果 。 有 些 程序 ， 如 cron 守 护 进程 ， 每 分 钟 运 
行 一 次 ， 它 是 如 何 处 理 这 类 工作 的 ? 

10.11 修改 图 3-5 的 程序 ， 要 求 : (a) 将 BUFFSIZE 改 为 100; (b) 











用 Signal_intr 函 数 捕捉 SIGXFSZ 信 号 量 并 打印 消息 ， 然 后 从 信和 号 处 理 程 
EPRE; Co) 如 果 没 有 写 满 请 求 的 字 节 数 ， 则 打印 write 的 返回 值 。 
将 软 资源 限制 RLIMIT_FSIZE 〈 见 7.11 节 ) 更 改 为 1 024 字 节 (shell 
设置 软 资 源 限制 ， 如 果 不 行 就 直接 在 程序 中 调用 setrlimit) ， 然 后 复制 
一 个 大 于 1 024 字 节 的 文件 ， 在 各 种 不 同 的 系统 上 运行 新 程序 ， 其 结果 
如 何 ? 为 什么 ? 

10.12 ”编写 一 段 调用 fwrite 的 程序 ， 它 使 用 一 个 较 大 的 缓冲 区 〈 约 1 
GB) ， 调 用 fwrite 前 调用 alarm 使 得 1s 以 后 产生 信号 。 在 信号 处 理 程序 中 
打印 捕捉 到 的 信号 ， 然 后 返回 。fwrite 可 以 完成 吗 ? 结果 如 何 ? 
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在 前 面 的 章节 中 讨论 了 进程 ， 学 习 了 UNIX 进 程 的 环境 、 进 程 闻 的 
可 以 看 到 在 相关 的 进程 间 可 以 存在 一 定 
JIo 

本 章 将 进一步 深入 理解 进程 ， 了 解 如 何 使 用 多 个 控制 线程 〈 或 者 简 
单 地 说 就 是 线程 ) 在 单 进程 环境 中 执行 多 个 任务 。 一 个 进程 中 的 所 有 线 
程 都 可 以 访问 该 进程 的 组 成 部 件 ， 如 文件 描述 符 和 内 存 。 

不 管 在 什么 情况 下 ， 只 要 单个 资源 需要 在 多 个 用 户 间 共享 ， 就 必须 
处 理 一 致 性 问题 。 本 章 的 最 后 将 讨论 目前 可 用 的 同步 机 制 ， 防 止 多 个 线 
程 在 共享 资源 时 出 现 不 一 致 的 问题 。 











11.2 线程 概念 


典型 的 UNIX 进 程 可 以 看 成 只 有 一 个 控制 线程 : 一 个 进程 在 某 一 时 
刻 只 能 做 一 件 事情 。 有 了 多 个 控制 线程 以 后 ， 在 程序 设计 时 就 可 以 把 进 
程 设 计 成 在 某 一 时 刻 能 够 做 不 止 一 件 事 ， 每 个 线程 处 理 各 自 独 立 的 任 
务 。 这 种 方法 有 很 多 好 处 。 

“通过 为 每 种 事件 类 型 分 配 单独 的 处 理 线程 ， 可 以 简化 处 理 异 步 事 
件 的 代码 。 每 个 线程 在 进行 事件 处 理 时 可 以 采用 同步 编程 模式 ， 同 步 统 
程 模式 要 比 异 步 编 程 模式 简单 得 多 。 

。 多 个 进程 必须 使 用 操作 系统 提供 的 复杂 机 制 才能 实现 内 存 和 文件 
描述 符 的 共享 ， 我 们 将 在 第 15 章 和 第 17 章 中 学 习 这 方面 的 内 容 。 而 多 
个 线程 自动 地 可 以 访问 相同 的 存储 地 址 空间 和 文件 描述 符 。 

。* 有 些 问 题 可 以 分 解 从 而 提高 整个 程序 的 吞吐 量 。 在 只 有 一 个 控制 
线程 的 情况 下 ， 一 个 单线 程 进程 要 完成 多 个 任务 ， 只 需要 把 这 些 任务 串 
行 化 。 但 有 多 个 控制 线程 时 ， 相 互 独立 的 任务 的 处 理 就 可 以 交叉 进行 ， 
此 时 只 需要 为 每 个 任务 分 配 一 个 单独 的 线程 。 当 然 只 有 在 两 个 任务 的 处 
理 过 程 互 不 依赖 的 情况 下 ， 两 个 任务 才 可 以 交叉 执行 。 

“交互 的 程序 同样 可 以 通过 使 用 多 线程 来 改善 啊 应 时 间 ， 多 线程 可 
以 把 程序 中 处 理 用 户 输入 输出 的 部 分 与 其 他 部 分 分 开 。 

有 些 人 把 多 线程 的 程序 设计 与 多 处 理 器 或 多 核 系 统 联系 起 来 。 但 是 
即使 程序 运行 在 单 处 理 器 上 ， 也 能 得 到 多 线程 编程 模型 的 好 人 处。 处 理 占 
的 数量 并 不 影响 程序 结构 ， 所 以 不 管 处 理 器 的 个 数 多 少 ， 程 序 都 可 以 通 
过 使 用 线程 得 以 简化 。 而 且 ， 即 使 多 线程 程序 在 串 行 化 任务 时 不 得 不 阻 
塞 ， 由 于 某 些 线程 在 阻塞 的 时 候 还 有 另外 一 些 线程 可 以 运行 ， 所 以 多 线 
程 程序 在 单 处 理 器 上 运行 还 是 可 以 改善 响应 时 间 和 吞吐 量 。 

每 个 线程 都 包含 有 表示 执行 环境 所 必需 的 信息 ， 其 中 包括 进程 中 标 
识 线 程 的 线程 ID、 一 组 寄存 器 值 、 栈 、 调 度 优 先 级 和 策略 、 信 和 号 屏蔽 
字 、errno 变 量 〈 见 1.7 节 ) 以 及 线程 私有 数据 〈 见 12.6” 节 ) 。 一 个 进程 
的 所 有 信息 对 该 进程 的 所 有 线程 都 是 共享 的 ， 包 括 可 执行 程序 的 代码 、 
程序 的 全 局 内 存 和 堆 内 存 、 栈 以 及 文件 描述 符 。 

我 们 将 要 讨论 的 线程 接口 来 自 POSIX.1-2001。 线 程 接口 也 称 
为 “pthread” 或 ‘POSIX 线 程 "， 原 来 在 POSIX.1-2001 中 是 一 个 可 选 功能 ， 
但 后 来 SUSv4 把 它们 放 入 了 基本 功能 。POSIX 线 程 的 功能 测试 宏 是 
_POSIX_THREADS。 应 用 程序 可 以 把 这 个 宏 用 于 ##fdef 测 试 ， 从 而 在 编 



























































译 时 确定 是 否 支 持 线 程 ， 也 可 以 把 _SC_THREADS 常 数 用 于 调用 sysconf 
函数 ， 进 而 在 运行 时 确定 是 否 支持 线程 。 遵 循 SUSv4 的 系统 定义 符号 
_POSIX_THREADS 的 值 为 200809L 。 


11.3 线程 标识 


融 像 每 个 进程 有 一 个 进程 ID 一 样 ， 每 个 线程 也 有 一 个 线程 ID。 进 程 
ID 在 整个 系统 中 是 唯一 的 ， 但 线程 ID 不 同 ， 线 程 ID 只 有 在 它 所 属 的 进程 
上 下 文中 才 有 意义 。 

回忆 一 下 进程 ID， 它 是 用 pid_t 数 据 类 型 来 表示 的 ， 是 一 个 非 负 整 
数 。 线 程 ID 是 用 pthread t 数 据 类 型 来 表示 的 ， 实 现 的 时 候 可 以 用 一 个 结 
构 来 代表 pthread {t 数 据 类 型 ， 所 以 可 移植 的 操作 系统 实现 不 能 把 它 作为 
整数 处 理 。 因 此 必须 使 用 一 个 函数 来 对 两 个 线程 ID 进行 比较 。 

#include <pthread.h> 

int pthread_equal(pthread_t tid1, pthread_t tid2); 

返回 值 : 奋 相 等， 返回 非 0 数 值 ; 人 否则， 返回 0 

Linux 3.2.0 使 用 无 符号 长 整 型 表示 pthread_t 数 据 类 型 。Solaris 10 把 
pthread t 数 据 类 型 表示 为 无 符号 整 型 。FreeBSD 8.0 和 Mac OS X 10.6.8 用 
一 个 指 同 pthread 结 构 的 指针 来 表示 pthread_t 数 据 类 型 。 

用 结构 表示 pthread_t 数 据 类 型 的 后 果 是 不 能 用 一 种 可 移植 的 方式 打 
印 该 数据 类 型 的 值 。 在 程序 调试 过 程 中 打印 线程 ID 有 时 是 非常 有 用 的 ， 
而 在 其 他 情况 下 通常 不 需要 打印 线程 DD。 最 坏 的 情况 是 ， 有 可 能 出 现 不 
可 移植 的 调试 代码 ， 当 然 这 也 算 不 上 是 很 大 的 局 限 性 。 

线程 可 以 通过 调用 pthread_self 函 数 获得 自身 的 线程 ID。 

#include <pthread.h> 

pthread_t pthread_self(void); 


























返回 值 : 调用 线程 的 线程 ID 
当 线 程 需要 识别 以 线程 ID 作为 标识 的 数据 结构 时 ，pthread_self 函 数 
可 以 与 pthread_equal 函 数 一 起 使 用 。 例 如 ， 主 线程 可 能 把 工作 任务 放 在 
一 个 队列 中 ， 用 线程 ID 来 控制 每 个 工作 线程 处 理 哪些 作业 。 如 图 11-1 所 
示 ， 主 线程 把 新 的 作业 放 到 一 个 工作 队列 中 ， 由 3 个 工作 线程 组 成 的 线 
程 池 从 队列 中 移出 作业 。 主 线程 不 允许 每 个 线程 任意 处 理 从 队列 顶端 取 
出 的 作业 ， 而 是 由 主线 程控 制作 业 的 分 配 ， 主 线程 会 在 每 个 竺 处理 作业 
a 每 个 工作 线程 只 能 移出 标 有 自己 线 
于 ID 的 作业 。 








图 11-1 工作 队列 实例 


11.4 线程 创建 


在 传统 UNIX 进 程 模型 中 ， 每 个 进程 只 有 一 个 控制 线程 。 从 概念 上 
讲 ， 这 与 基于 线程 的 模型 中 每 个 进程 只 包含 一 个 线程 是 相同 的 。 在 
POSIX 线 程 (pthread) 的 情况 下 ， 程 序 开始 运行 时 ， 它 也 是 以 单 进程 中 
的 单个 控制 线程 启动 的 。 在 创建 多 个 控制 线程 以 前 ， 程 序 的 行为 与 传统 
i 进程 并 没有 什么 区 别 。 新 增 的 线程 可 以 通过 调用 pthread_create 函 数 创 
建 。 

#include <pthread.h> 

int pthread_create(pthread_t *restrict tidp, 

const pthread_attr_t *restrict attr, 
void *(*start_rtn)(void *), void *restrict arg); 
返回 值 : 知 成 功 ， 返 回 0; 否则， 返回 错误 编号 

当 pthread_create 成 功 返 回 时 ， 新 创建 线程 的 线程 ID 会 被 设置 成 tidp 
指 同 的 内 存单 元 。attr 参 数 用 于 定制 各 种 不 同 的 线程 属性 。 我 们 将 在 12.3 
但 现在 我 们 把 它 置 为 NULL， 创 建 一 个 具有 默认 属 
1 JZ 早 。 

新 创建 的 线程 从 start_rtn 函 数 的 地 址 开始 运行 ， 该 函数 只 有 一 个 无 
类 型 指针 参数 arg。 如 果 需 要 向 start_rtn 函 数 传 递 的 参数 有 一 个 以 上 ， 那 
. ig ee ae 中 ， 然 后 把 这 个 结构 的 地 址 作为 arg 参 

线程 创建 时 并 不 能 保证 哪个 线程 会 先 运行 ， 是 新 创建 的 线程 ， 还 是 
调用 线程 。 新 创建 的 线程 可 以 访问 进程 的 地 址 空间 ， 并 且 继 承 调用 线程 
的 浮 点 环境 和 信号 屏蔽 字 ， 但 是 该 线程 的 挂 起 信号 集会 被 清除 。 

注意 ，pthread ”函数 在 调用 失败 时 通常 会 返回 错误 码 ， 它 们 并 不 像 
其 他 的 POSIX 函数 一 样 设置 errno。 每 个 线程 都 提供 errno 的 副本 ， 这 只 
是 为 了 与 使 用 errno 的 现 有 函数 兼容 。 在 线程 中 ， 从 函数 中 返回 错误 码 更 
为 清晰 整洁 ， 不 需要 依赖 那些 随 着 函数 执行 不 断 变 化 的 全 局 状态 ， 这 样 
0 

实例 

虽然 没有 可 移植 的 打印 线程 ID 的 方法 ， 但 是 可 以 写 一 个 小 的 测试 
程序 来 完成 这 个 任务 ， 以 便 更 深入 地 了 解 线 程 是 如 何 工 作 的 。 图。 11-2 
中 的 程序 创建 了 一 个 线程 ， 打 印 了 进程 ID、 新 线程 的 线程 ID 以 及 初始 
线程 的 线程 ID。 














#include "apue.h" 
#include “pthread,h> 


pthread_t ntid; 


void 
printids(const char *s) 
{ 
pidt pid; 
pthread_t tid: 


pid = getpid(); 

tid = pthread_self(); 

printf("%s pid %lu tid $lu (0x%1x)\n", s, (unsigned long) pid, 
(unsigned long)tid, (unsigned long) tid); 


void * 

thr_fn(void *arg) 

{ 
printids ("new thread: "); 
return((void *)0); 


int 
main (void) 
{ 


int err; 


err = pthread create (&ntid, NULL, thr_fn, NULL); 
if (err != 0) 

err exit (err, "can't create thread"); 
printids ("main thread:"); 
sleep (1); 
exit (0); 





图 11-2 打印 线程 ID 
这 个 实例 有 两 个 特别 之 处 ， 需 要 处 理 主线 程 和 新 线程 之 间 的 函 争 。 
(我 们 将 在 这 章 后 面 的 内 容 中 学 习 如 何 更 好 地 处 理 这 种 竞争 。) 第 一 个 
特别 之 处 在 于 ， 主 线程 需要 休 虐 ， 如 果 主 线程 不 休眠 ， 它 就 可 能 会 退 
出 ， 这 样 新 线程 还 没有 机 会 运行 ， 整 个 进程 可 能 就 已 经 终止 了 。 这 种 行 
为 特征 依赖 于 操作 系统 中 的 线程 实现 和 调度 算法 。 

第 二 个 特别 之 处 在 于 新 线程 是 通过 调用 pthread_self 函 数 获取 上 自己 的 
线程 ID 的 ， 而 不 是 从 共享 内 存 中 读 出 的 ， 或 者 从 线程 的 司 动 例 程 中 以 参 
数 的 形式 接收 到 的 。 回 忆 pthread_create 函 数 ， 它 会 通过 第 一 个 参数 

(tidp) 返回 新 建 线程 的 线程 ID。 在 这 个 例子 中 ， 主 线程 把 新 线程 ID 存 
放 在 ntid 中 ， 但 是 新 建 的 线程 并 不 能 安全 地 使 用 它 ， 如 采 新 线程 在 主线 
程 调 用 pthread_create 返 回 之 前 就 运行 了 ， 那 么 新 线程 看 到 的 是 未 经 初始 
化 的 ntid 的 内 容 ， 这 个 内 容 并 不 是 正确 的 线程 ID 。 

在 Solaris 上 运行 图 11-2 中 的 程序 ， 得 到 : 

$ ./a.out 

main thread: pid 20075 tid 1 (0x1) 

new thread: pid 20075 tid 2 (0x2) 

正如 我 们 期 望 的 ， 两 个 线程 的 进程 ID 相同 ， 但 线程 ID 不 同 。 在 
FreeBSD 上 运行 图 11-2 中 的 程序 ， 得 到 : 

$ ./a.out 

main thread: pid 37396 tid 673190208 (0x28201140) 

new thread: pid 37396 tid 673280320 (0x28217140) 

也 如 我 们 期 望 的 ， 两 个 线程 有 相同 的 进程 ID。 如 有 末 把 线程 ID 看 成 是 
十 进 制 整数 ， 那 么 这 两 个 值 看 起 来 很 奇怪 ， 但 是 如 采 把 它们 转化 成 十 六 
进 制 ， 看 起 来 就 更 合理 了 。 束 像 前 面 提 到 的 ，FreeBSD 使 用 指 问 线程 数 
据 结构 的 指针 作为 它 的 线程 ID。 

我 们 期 望 Mac OS X 与 FreeBSD 相 似 ， 但 事实 上 ， 在 Mac OS X 中 ， 
主线 程 ID 与 用 pthread_create 新 创建 的 线程 的 线程 ID 不 在 相同 的 地 址 范 
内 : 























$ ./a.out 

main thread: pid 31807 tid 140735073889440 (0x7fff70162ca0) 

new thread: pid 31807 tid 4295716864 (0x1000b7000) 

相同 的 程序 在 Linux 上 运行 得 到 : 

$ ./a.out 

main thread: pid 17874 tid 140693894424320 (0x7ff5d9996700) 

new thread: pid 17874 tid 140693886129920 (0x7ff5d91ad700) 

尽管 Linux 线 程 ID 是 用 无 符号 长 整 型 来 表示 的 ， 但 是 它们 看 起 来 像 








指针 。 

Linux ”2.4 和 Linux ”2.6 在 线程 实现 上 是 不 同 的 。Linux 2.47, 
LinuxThreads 是 用 单独 的 进程 实现 每 个 线程 的 ， 这 使 得 它 很 难 与 POSIX 
线程 的 行为 匹配 。Linux ” 2.6 中， 对 Linux 内 核 和 线程 库 进 行 了 很 大 的 修 
改 ， 采 用 了 一 个 称 为 Native POSIX 线程 库 (Native POSIX Thread 
Library, NPTL) 的 新 线程 实现 。 它 支持 单个 进程 中 有 多 个 线程 的 模 
型 ， 也 更 容易 支持 POSIX 线 程 的 语义 。 








11.5 线程 终止 


如 果 进 程 中 的 任意 线程 调用 了 exit、_Exit 或 者 _exit， 那 么 整个 进程 
就 会 终止 。 与 此 相 类 似 ， 如 宁 默 认 的 动作 是 终止 进程 ， 那 么 ， 发 送 到 线 
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单个 线程 可 以 通过 3 种 方式 退出 ， 因 此 可 以 在 不 终止 整个 进程 的 情 
况 下 ， 停 止 它 的 控制 流 。 

(1) 线程 可 以 简单 地 从 启动 例 程 中 返回 ， 返 回 值 是 线程 的 退出 
码 。 


(2) 线程 可 以 被 同一 进程 中 的 其 他 线程 取消 。 
(3) 线程 调用 pthread_exit。 
#include <pthread.h> 
void pthread_exit(void *rval_ptr); 
rVal_ptr ”参数 是 一 个 无 类 型 指针 ， 与 传 给 局 动 例 程 的 单个 参数 类 
进程 中 的 其 他 线程 也 可 以 通过 调用 pthread_join 函 数 访问 到 这 个 指 











似 。 
a 
#include <pthread.h> 
int pthread_join(pthread_t thread, void **rval_ptr); 
返回 值 : 知 成 功 ， 返 回 0; 人 否则， 返回 错误 编号 

调用 线程 将 一 直 阻 塞 ， 直 到 指定 的 线程 调用 pthread_exit、 从 局 动 例 
程 中 返回 或 者 被 取消 。 如 果 线 程 简单 地 从 它 的 启动 例 程 返回 ，rval_ptr 就 
包含 返回 码 。 如 果 线 程 被 取消 ， 由 rval_ptr 指 定 的 内 存单 元 就 设置 为 
PTHREAD_ CANCELED. 

可 以 通过 调用 pthread join 自动 把 线程 置 于 分 离 状态 〈 马 上 就 会 讨论 
到 ) ， 这 样 资源 就 可 以 恢复 。 如 果 线 程 已 经 处 于 分 离 状 态 ，pthread_join 
调用 就 会 失败 ， 返 回 EINVAL， 尽 管 这 种 行为 是 与 具体 实现 相关 的 。 

如 果 对 线程 的 返回 值 并 不 感 兴趣 ， 那 么 可 以 把 rval_ptr 设 置 为 
NULL。 在 这 种 情况 下 ， 调 用 pthread_join 函 数 可 以 等 待 指定 的 线程 终 
A a 
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图 11-3 展 示 了 如 何 获 取 已 终止 的 线程 的 退出 码 。 











include "apue ,hn 
tinclude <pthread.h> 


void * 

thr fnl (void *arg) 

| 
printf ("thread 1 returning\n"); 
return((void *)1); 


void * 

thr fn2(void *arg) 

| 
printf ("thread 2 exiting\n"); 
pthread exit ( (void *)2); 


int 

main (void) 

| 
int err; 
pthread t tidl, tid2; 
void *tret; 


err = pthread_create(&tidl, NULL, thr_fnl, NULL); 
if (err != 0) 

err exit (err, "can't create thread 1"); 
err = pthread create (&tid2, NULL, thr fn2, NULL); 


if (err != 0) 

err exit(err, "can't create thread 2"); 
err = pthread_join(tidl, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printf ("thread 1 exit code ld\n", (long) tret) ; 
err = pthread_join(tid2, &tret) ; 
if (err != 0) 

err exit(err, "can't join with thread 2"); 
printf ("thread 2 exit code tld\n", (long) tret); 











exit (0); 

图 11-3 获得 线程 退出 状态 
运行 图 11-3 中 的 程序 ， 得 到 的 结果 是 : 
$ ./a.out 


thread 1 returning 

thread 2 exiting 

thread 1 exit code 1 

thread 2 exit code 2 

可 以 看 到 ， 当 一 个 线程 通过 调用 pthread_exit 退 出 或 者 简单 地 从 启动 
例 程 中 返回 时 ， 进 程 中 的 其 他 线程 可 以 通过 调用 pthread_ join 函数 获得 该 
线程 的 退出 状态 。 

pthread_create 和 pthread_exit 函 数 的 无 类 型 指针 参数 可 以 传递 的 值 不 
止 一 个 ， 这 个 指针 可 以 传递 包含 复杂 信息 的 结构 的 地 址 ， 但 是 注意 ， 这 
个 结构 所 使 用 的 内 存在 调用 者 完成 调用 以 后 必须 仍然 是 有 效 的 。 例 如 ， 
在 调用 线程 的 栈 上 分 配 了 该 结构 ， 那 么 其 他 的 线程 在 使 用 这 个 结构 时 内 
存 内 容 可 能 已 经 改变 了 。 双 如， 线程 在 自己 的 栈 上 分 配 了 一 个 结构 ， 然 
后 把 指向 这 个 结构 的 指针 传 给 pthread_exit， 那 么 调用 pthread_join 的 线程 
J 该 结构 时 ， 这 个 栈 有 可 能 已 经 被 撤销 ， 这 块 内 存 也 已 另 作 他 

实例 

图 11-4 中 的 程序 给 出 了 用 自动 变量 (分 配 在 栈 上 ) 作为 pthread_exit 











的 参数 时 出 现 的 问题 。 


#include "apue.h" 
finclude <pthread.h> 


struct foo { 
ME Bw By Gr BE 


void 
printfoo(const char *s, const struct foo *fp) 
| 
printf ("%s", s); 
printf(" structure at Oxtlx\n", (unsigned long)fp); 
printf(" foo.a = %d\n", fp->a); 
printf(" foo.b = $d\n", fp->b); 
printf(" foo.c = $d\n", fp->c); 
printf(" foo.d = %d\n", fp->d); 














void * 
thr_fn1 (void *arg) 
{ 
struct foo foo = (ly 2, 3, 4}; 


printfoo("thread 1:\n", &foo); 
pthread exit ( (void *) &foo) ; 


void * 

thr_fn2(void *arg) 

{ 
printf ("thread 2: ID is $lu\n", (unsigned long) pthread_self()); 
pthread_exit((void *)0); 


int 

main (void) 

{ 
int err; 
pthread_t tidl, tid2; 
struct foo *fp; 


err = pthread_create(&tidl, NULL, thr_fnl, NULL); 
if (err != 0) 
err_exit(err, "can't create thread 1"); 
err = pthread_join(tidl, (void *) éfp); 
if (err != 0) 
err exit (err, "can't join with thread 1"); 
sleep (1); 
printf ("parent starting second thread\n") ; 
err = pthread_create(&tid2, NULL, thr_fn2, NULL); 


if (err != 0) 
err exit(err, "can't create thread 2"); 
sleep (1); 


printfoo("parent:\n", fp); 
exit (0); 


图 11-4 pthread_exit 参 数 的 不 正确 使 用 
在 Linux 上 运行 此 程序 ， 得 到 : 
$ ./a.out 
thread 1: 
structure at Ox7f2c83682ed0 
foo.a=1 
foo.b=2 
foo.c=3 
foo.d=4 
parent starting second thread 
thread 2: ID is 139829159933696 
parent: 
structure at Ox7f2c83682ed0 
foo.a = -2090321472 
foo.b = 32556 
foo.c=1 
foo.d=0 
当然 ， 运 行 结果 根据 内 存 体系 结构 、 编 译 器 以 及 线程 库 的 实现 会 有 
所 不 同 。 在 Solaris 上 的 结果 类 似 : 
$ ./a.out 
thread 1: 
structure at Oxffffffff7f0fbf30 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 
parent starting second thread 
thread 2: ID is 3 
parent: 
structure at Oxffffffff7 f0fbf30 
foo.a = -1 
foo.b = 2136969048 
foo.c = -1 
foo.d = 2138049024 
可 以 看 到 ， 当 主线 程 访 问 这 个 结构 时 ， 结 构 的 内 容 〈 在 线程 tid1 的 
栈 上 分 配 的 ) 已 经 改变 了 。 注 意 第 二 个 线程 〈tid2) 的 栈 是 如 何 履 盖 第 
一 个 线程 的 栈 的 。 为 了 解决 这 个 问题 ， 可 以 使 用 全 局 结构 ， 或 者 用 





malloc 函 数 分 配 结构 。 
在 Mac OS X 上 运行 的 结果 有 所 不 同 : 
$ ./a.out 
thread 1: 
structure at 0x1000b6f00 
foo.a=1 
foo.b=2 
foo.c=3 
foo.d=4 
parent starting second thread 
thread 2: ID is 4295716864 
parent: 
structure at 0x1000b6f00 
Segmentation fault (core dumped) 
在 这 种 情况 下 ， 父 进程 试图 访问 已 退出 的 第 一 个 线程 传 给 它 的 结构 
时 ， 内 存 不 再 有 效 ， 这 时 得 到 的 是 SIGSEGV 信 和 号 。 
FreeBSD 上 ， 父 进程 访问 内 存 时 ， 内 存 并 没有 被 履 写 ， 得 到 的 结果 
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thread 1: 
structure at Oxbf9fef88 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 
parent starting second thread 
thread 2: ID is 673279680 
parent: 
structure at Oxbf9fef88 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 
虽然 线程 退出 后 ， 内 存 依然 是 完整 的 ， 但 我 们 不 能 期 望 情况 总 是 这 
样 的 。 从 其 他 平台 上 的 结果 中 可 以 看 出 ， 情 况 并 不 都 是 这 样 的 。 
二 线程 可 以 通过 调用 pthread_cancel 函 数 来 请 求 取 消 同一 进程 中 的 其 他 
> [H 
EXC NE o 
#include <pthread.h> 


int pthread_cancel(pthread_t tid); 
BEHE: ERJ, elo; FU, BERS 

在 默认 情况 下 ，pthread_cancel ”函数 会 使 得 由 tid 标 识 的 线程 的 行为 
表现 为 如 同调 用 了 参数 为 PTHREAD_ CANCELED 的 pthread_exit 函数 ， 
但 是 ， 线 程 可 以 选择 忽略 取消 或 者 控制 如 何 被 取消 。 我 们 将 在 12.7 节 中 
详细 讨论 。 注 意 pthread_cancel 并 不 等 竺 线程 终止 ， 它 仅仅 提出 请 求 。 

线程 可 以 安排 它 退 出 时 需要 调用 的 函数 ， 这 与 进程 在 退出 时 可 以 用 
atexit 函 数 〈 见 7.3 节 ) 安排 退出 是 类 似 的 。 这 样 的 函数 称 为 线程 清理 处 
理 程序 (thread cleanup handler) 。 一 个 线程 可 以 建立 多 个 清理 处 理 程 
序 。 处 理 程序 记录 在 栈 中 ， 也 就 是 说 ， 它 们 的 执行 顺序 与 它们 注册 时 相 
反 








#include <pthread.h> 

void pthread_cleanup_push(void (*rtn)(void *), void *arg); 

void pthread_cleanup_pop(int execute); 

SZRETT LA FJER, da R Arm Hpthread_cleanup_push PA 2% 
调度 的 ， 调 用 时 只 有 一 个 参数 arg: 

。 调 用 pthread_exit 时 ; 

“ 啊 应 取消 请 求 时 ; 

用 非 零 execute 参 数 调用 pthread_cleanup_pop 时 。 

WR execute 参数 设置 为 0， 清 理 函 数 将 不 被 调用 。 不 管用 生 上 述 
哪 种 情况 ，pthread_cleanup_pop 都 将 删除 上 次 pthread_cleanup_push 调 用 
建立 的 清理 处 理 程序 。 

这 些 函数 有 一 个 限制 ， 由 于 和 它们 可 以 实现 为 宏 ， 所 以 必须 在 与 线程 
相同 的 作用 域 中 以 匹配 对 的 形式 使 用 。pthread_cleanup_push ”的 宏 定 义 
可 以 包含 字符 {， 这 种 情况 下 ， 在 ”pthread_cleanup_pop 的 定义 中 要 有 对 
应 的 匹配 字符 }。 

实例 

图 11-5 给 出 了 一 个 如 何 使 用 线程 清理 处 理 程序 的 例子 。 虽 然 例子 是 
人 为 编造 的 ， 但 它 描述 了 其 中 涉及 的 清理 机 制 。 注 意 ， 虽 然 我 们 从 来 没 
想 过 要 传 一 个 参数 0 给 线程 启动 例 程 ， 但 还 是 需要 把 pthread_cleanup_pop 
调用 和 pthread_cleanup_push 调 用 [匹配 起 来 ， 否 则 ， 程 序 编译 就 可 能 通 不 











finclude "apue ,hn 
tinclude <pthread.h> 


void 
cleanup(void *arg) 


| 


printf("cleanup: %s\n", (char *)arg); 


void * 
thr_fnl(void *arg) 
{ 
printf ("thread 1 start\n"); 
pthread_cleanup_push(cleanup, “thread 1 first handler"); 
pthread_cleanup_push(cleanup, "thread 1 second handler"); 
printf("thread 1 push complete\n"); 
if (arg) 
return((void *)1); 
pthread_cleanup_pop (0) ; 
pthread_cleanup_pop (0); 
return( (void *)1); 


void * 
thr_fn2(void *arg) 
{ 
printf("thread 2 start\n"); 
pthread_cleanup_push(cleanup, "thread 2 first handler"); 
pthread_cleanup_push(cleanup, “thread 2 second handler"); 
printf ("thread 2 push complete\n"); 
if (arg) 
pthread_exit((void *)2); 
pthread_cleanup pop (0); 
pthread_cleanup_pop (0); 
pthread_exit((void *)2); 


int 
main (void) 


{ 


int err; 
pthread_t tidi, tiaz; 
void *tret; 


err = pthread_create(&tidl, NULL, thr_fnl, (void *)1); 
if (err != 0) 
err exit(err, "can't create thread 1"); 
err = pthread_create(&tid2, NULL, thr fn2, (void *)1); 
if (err != 0) 
err exit (err, "can't create thread 2"); 
err = pthread_join(tidl, &tret); 
if (err != 0) 
err_exit(err, "can't join with thread 1"); 
printf ("thread 1 exit code %ld\n", (long)tret); 
err = pthread_join(tid2, &tret); 
if (err != 0) 
err_exit(err, "can't join with thread 2"); 
printf("thread 2 exit code %ld\n", (long)tret); 
exit (0); 

















图 11-5 线程 清理 处 理 程序 

在 Linux 或 者 Solaris 上 运行 图 11-5 中 的 程序 会 得 到 : 

$ ./a.out 

thread 1 start 

thread 1 push complete 

thread 2 start 

thread 2 push complete 

cleanup: thread 2 second handler 

cleanup: thread 2 first handler 

thread 1 exit code 1 

thread 2 exit code 2 

从 输出 结果 可 以 看 出 ， 两 个 线程 都 正确 地 启动 和 退出 了 ， 但 是 只 有 
第 二 个 线程 的 清理 处 理 程序 被 调用 了 。 因 此 ， 如 果 线 程 是 通过 从 它 的 启 
动 例 程 中 返回 而 终止 的 话 ， 它 的 清理 处 理 程 序 就 不 会 被 调用 。 还 要 注 
意 ， 清 理 处 理 程序 是 按照 与 它们 安装 时 相反 的 顺序 被 调用 的 。 

如 果 在 FreeBSD 或 者 Mac OS X 上 运行 相同 的 程序 ， 可 以 看 到 程序 会 
出 现 段 异常 并 产生 core 文 件 。 这 是 因为 在 这 两 个 平台 上 ， 
pthread_cleanup_push 是 用 宏 实 现 的 ， 而 宏 把 某 些 上 下 文 存放 在 栈 上 。 当 
线程 1 在 调用 pthread_cleanup_push 和 调用 pthread_cleanup_pop 之 间 返 回 
时 ， 栈 已 被 改写 ， 而 这 两 个 平台 在 调用 清理 处 理 程序 时 就 用 了 这 个 被 改 
写 的 上 下 文 。 在 Single UNIX Specification 中 ， 函 数 如 果 在 调用 
pthread_cleanup_push 和 pthread_cleanup_pop 之 间 返 回 ， 会 产生 未 定义 行 
为 。 唯 一 的 可 移植 方法 是 调用 pthread_exit。 

现在 ， 让 我 们 了 解 一 下 线程 函数 和 进程 函数 之 间 的 相似 之 处 。 图 
11-6 总 结 了 这 些 相似 的 函数 。 


进程 原 语 线程 原 语 


fork pthread create 创建 新 的 控制 流 
exit pthread exit 从 现 有 的 控制 流 中 退出 






































waltpid pthread join 从 控制 流 中 得 到 退出 状态 
atexit pthread_cancel_push 注册 在 退出 控制 流 时 调用 的 函数 
getpid pthread self PEE UH ID 

abort pthread_cancel 请 求 控 制 流 的 非 正常 退出 














图 11-6 进程 和 线程 原 语 的 比较 

在 默认 情况 下 ， 线 程 的 终止 状态 会 保存 直到 对 该 线程 调用 
pthread_join。 如 果 线 程 已 经 被 分 离 ， 线 程 的 底层 存储 资源 可 以 在 线程 终 
止 时 立即 被 收回 。 在 线程 被 分 离 后 ， 我 们 不 能 用 pthread_join 函 数 等 符 它 
的 终止 状态 ， 因 为 对 分 离 状 态 的 线程 调用 pthread_join 会 产生 未 定义 行 
为 。 可 以 调用 pthread_detach 分 离线 程 。 

#include <pthread.h> 

int pthread_detach(pthread_t tid); 

返回 值 : ARD, WO; 否则 ， 返 回 错误 编号 

在 下 一 童 里 ， 我 们 将 学 习 通 过 修改 传 给 pthread_create 函 数 的 线程 属 

性 ， 创 建 一 个 已 处 于 分 离 状态 的 线程 。 














11.6 线程 同步 


当 多 个 控制 线程 共 孚 相同 的 内 存 时 ， 需 要 确保 每 个 线程 看 到 一 致 的 
数据 视图 。 如 果 每 个 线程 使 用 的 变量 都 是 其 他 线程 不 会 读 取 和 修改 的 ， 
那么 就 不 存在 一 致 性 问题 。 同 样 ， 如 果 变 量 是 只 读 的 ， 多 个 线程 同时 读 
取 该 变量 也 不 会 有 一 致 性 问题 。 但 是 ， 当 一 个 线程 可 以 修改 的 变量 ， 其 
他 线程 也 可 以 读 取 或 者 修改 的 时 候 ， 我 们 就 需要 对 这 些 线程 进行 同步 ， 
确保 它们 在 访问 变量 的 存储 内 容 时 不 会 访问 到 无 效 的 值 。 

当 一 个 线程 修改 变量 时 ， 其 他 线程 在 读 取 这 个 变量 时 可 能 会 看 到 一 
个 不 一 致 的 值 。 在 变量 修改 时 间 多 于 一 个 存储 器 访问 周期 的 处 理 器 结构 
中 ， 当 存储 器 读 与 存储 器 写 这 两 个 周期 交叉 时 ， 这 种 不 一 致 就 会 出 现 。 
当然 ， 这 种 行为 是 与 处 理 圳 体系 结构 相关 的 ， 但 是 可 移植 的 程序 并 不 能 
对 使 用 何 种 处 理 器 体系 结构 做 出 任何 假设 。 

图 11-7 描述 了 两 个 线程 读 写 相同 变量 的 假设 例子 。 在 这 个 例子 
中 ， 线 程 A 读 取 变 量 然 后 给 这 个 变量 赋予 一 个 新 的 数值 ， 但 写 操作 需要 
两 个 存储 器 周期 。 当 线程 B 在 这 两 个 存储 絮 写 周期 中 间 读 取 这 个 变量 
时 ， 它 就 会 得 到 不 一 致 的 值 。 

为 了 解决 这 个 问题 ， 线 程 不 得 不 使 用 锁 ， 同 一 时 间 只 允许 一 个 线程 
访问 该 变量 。 几 11-8 描 述 了 这 种 同步 。 如 果 线 程 B 希 望 读 取 变 量 ， 它 于 
先 要 获取 锁 。 同 样 ， 当 线程 A 更 新 变量 时 ， 也 需要 获取 同样 的 这 把 锁 。 
这 样 ， 线 程 B 在 线程 A 释 放 锁 以 前 就 不 能 读 取 变量 。 

















线程 A 线程 B 


图 11-7 两 个 线程 的 交叉 存储 器 周期 





线程 A 线程 B 





时 间 





图 11-8 两 个 线程 同步 内 存 访问 





两 个 或 多 个 线程 试图 在 同一 时 间 修 改 同一 变量 时 ， 也 需要 进行 同 
。 考 虑 变量 增 量 操 作 的 情况 〈 图 11-9) ， 增 量 操作 通常 分 解 为 以 下 3 


C1) 从 内 存单 元 读 入 寄存 器 。 

(2) 在 寄存 器 中 对 变量 做 增 量 操作 。 

(3) 把 新 的 值 写 回 内 存单 元 。 

如 于 两 个 线程 试图 几乎 在 同一 时 间 对 同一 个 变量 做 增 量 操作 而 不 进 
行 同步 的 话 ， 结 果 束 可 能 出 现 不 一 致 ， 变 量 可 能 比 原 来 增加 了 1， 也 有 
可 能 比 原来 增加 了 2， 具 体 增加 了 1 还 是 2 要 取决 于 第 二 个 线程 开始 操作 
时 获取 的 数值 。 如 果 第 二 个 线程 执行 第 1 步 要 比 第 一 个 线程 执行 第 3 步 要 
早 ， 第 二 个 线程 读 到 的 值 与 第 一 个 线程 一 样 ， 为 变量 加 1， 然 后 写 回 














去 ， 事 实 上 没有 实际 的 效果 ， 总 的 来 说 变量 只 增加 了 1。 

如 果 修 改 操 作 是 原子 操作 ， 那 么 就 不 存在 部 争 。 在 前 面 的 例子 中 ， 
如 果 增 加 1 只 需要 一 个 存储 器 周期 ， 那 么 吏 没 有 竞争 存在 。 如 果 数 据 总 
是 以 顺序 一 致 出 现 的 ， 就 不 需要 额外 的 同步 。 当 多 个 线程 观察 不 到 数据 
的 不 一 致 时 ， 那 么 操作 融 是 顺序 一 致 的 。 在 现代 计算 机 系统 中 ， 存 储 访 
问 需 要 多 个 总 线 周期 ， 多 处 理 器 的 总 线 周 期 通常 在 多 个 处 理 器 上 是 交叉 
的 ， 所 以 我 们 并 不 能 保证 数据 是 顺序 一 致 的 。 





线程 A 





将 计 取 入 寄存 器 
(寄存 器 = 5) 


对 寄存 器 内 容 做 
增 量 操作 
(寄存 器 = 6) 


时 间 
将 寄存 器 


内 容 存 入 i 
( 寄存 器 = 6) 





图 11-9 两 个 非 同步 的 线程 对 同一 个 变量 做 增 量 操作 


线程 B 





将 计 取 入 寄存 器 
(寄存 器 = 5) 





对 寄存 器 内 容 做 
增 量 操作 
(寄存 器 = 6) 


将 寄存 器 
内 容 存 入 i 
( 寄存 器 = 6) 














i 的 内 容 





在 顺序 一 致 环境 中 ， 可 以 把 数据 修改 操作 解释 为 运行 线程 的 顺序 操 
作 步 又。 可 以 把 这 样 的 操作 描述 为 “线程 A 对 变量 增加 了 1， 然 后 线程 B 
对 变量 增加 了 1， 所 以 变量 的 值 就 比 原 来 的 大 2”， 或 者 描述 为 “线程 B 对 








变量 增加 了 1， 然 后 线程 A 对 变量 增加 了 1， 所 以 变量 的 值 就 比 原来 的 大 


A T 


其 他 人 

除了 计算 机 体系 结构 以 外 ， 程 序 使 用 变量 的 方式 也 会 引起 竞争 ， 也 
会 导致 不 一 致 的 情况 发 生 。 例 如 ， 我 们 可 能 对 东 个 变量 加 1， 然 后 基于 
这 个 值 做 出 东 种 决定 。 因 为 这 个 增 量 操作 步骤 和 这 个 决定 步骤 的 组 合并 
非 原子 操作 ， 所 以 束 给 不 一 致 情况 的 出 现 提供 了 可 能 。 


11.6.1 FẸ 


可 以 使 用 pthread 的 互 斥 接口 来 保护 数据 ， 确 保 同 一 时 间 只 有 一 个 
线程 访问 数据 。 互 斥 量 (mutex) 从 本 质 上 说 是 一 把 锁 ， 在 访问 共享 资 
源 前 对 互 斥 量 进行 设置 〈 加 锁 ) ， 在 访问 完成 后 释放 《解锁 ) 互 斥 量 。 
对 互 斥 量 进行 加 锁 以 后 ， 任 何其 他 试图 再 次 对 互 斥 量 加 锁 的 线程 都 会 被 
阻塞 直到 当前 线程 释放 该 互 斥 锁 。 如 果 释 放 互 斥 量 时 有 一 个 以 上 的 线程 
阻塞 ， 那 么 所 有 该 锁 上 的 阻塞 线程 都 会 变 成 可 运行 状态 ， 第 一 个 变 为 运 
行 的 线程 就 可 以 对 互 斥 量 加 锁 ， 其 他 线程 就 会 看 到 互 斥 量 依然 是 锁 着 
的 ， 只 能 回去 再 次 等 待 它 重新 变 为 可 用 。 在 这 种 方式 下 ， 每 次 只 有 一 个 
线程 可 以 向 前 执行 。 

只 有 将 所 有 线程 都 设计 成 遵守 相同 数据 访问 规则 的 ， 互 斥 机 制 才能 
正常 工作 。 操 作 系 统 并 不 会 为 我 们 做 数据 访问 的 串 行 化 。 如 果 人 允许 其 中 
的 某 个 线程 在 没有 得 到 锁 的 情况 下 也 可 以 访问 共 至 资源 ， 那 么 即使 其 他 
的 线程 在 使 用 共享 资源 前 都 申请 锁 ， 也 还 是 会 出 现 数据 不 一 致 的 问题 。 

互 斥 变量 是 用 pthread_mnutex_t 数 据 类 型 表示 的 。 在 使 用 互 斥 变量 以 
前 ， 必 须 首先 对 它 进 行 初始 化 ， 可 以 把 它 设 置 为 音量 
PTHREAD_MUTEX_INITIALIZER“〔〈 只 适用 于 静态 分 配 的 互 斥 量 ) ， 也 
可 以 通过 调用 pthread_mnutex_init 函 数 进行 初始 化 。 如 果 动 态 分 配 互 斥 量 
〈 例 如， 通过 调用 malloc 函 数 ) ， 在 释放 内 存 前 需要 调用 
pthread_mutex_destroy. 

#include <pthread.h> 

int pthread_mutex_init(pthread_mutex_t *restrict mutex, 

const pthread_mutexattr_t *restrict attr); 

int pthread_mutex_destroy(pthread_mutex_t *mutex); 

两 个 函数 的 返回 值 : ARJ, eo; AM, WER S 

要 用 默认 的 属性 初始 化 互 斥 量 ， 只 需 把 attr 设 为 NULL。 我 们 将 在 
12.4 节 中 讨论 互 斥 量 属 性 。 

对 互 斥 量 进 行 加 锁 ， 需 要 调用 “pthread_mnutex_lock。 如 果 互 斥 量 已 
经 上 锁 ， 调 用 线程 将 阻塞 直到 互 斥 量 被 解锁 。 对 互 斥 量 解锁 ， 需 要 调用 









































pthread_mutex_unlock. 

#include <pthread.h> 

int pthread_mutex_lock(pthread_mutex_t *mutex); 

int pthread_mutex_trylock(pthread_mutex_t *mutex); 

int pthread_mutex_unlock(pthread_mutex_t *mutex); 

所 有 函数 的 返回 值 ， 夺 成功， 返回 90; 否则， 返回 错误 编号 

如 果 线 程 不 希望 被 阻 寨 ， 它 可 以 使 用 pthread_mutex_trylock 尝 试 对 
互 斥 量 进行 加 锁 。 如 果 调 用 pthread_mutex_trylock 时 互 斥 量 处 于 未 锁 住 
状态 ， 那 么 _pthread_mnutex_trylock 将 锁 住 互 斥 量 ， 不 会 出 现 阻 喜 直 接 返 
回 0， 和 否则 pthread_mutex_trylock 就 会 失败 ， 不 能 锁 住 互 斥 量 ， 返 回 
EBUSY 。 

实例 

图 11-10 描 述 了 用 于 保护 茶 个 数据 结构 的 互 斥 量 。 当 一 个 以 上 的 线 
程 需要 访问 动态 分 配 的 对 象 时 ， 我 们 可 以 在 对 象 中 舱 入 引用 计数 ， 确 保 
该 对 象 的 线程 完成 数据 访问 之 前 ， 该 对 象 内 存 空间 不 会 被 释 
Jo 

在 对 引用 计数 加 1、 减 1、 检 查 引 用 计数 是 否 到 达 0 这 些 操作 之 前 
需要 锁 住 互 斥 量 。 在 foo_alloc 函数 中 将 引用 计数 初始 化 为 1 时 没 必要 加 
锁 ， 因 为 在 这 个 操作 之 前 分 配 线程 是 唯一 引用 该 对 象 的 线程 。 但 是 在 这 
之 后 如 果 要 将 该 对 象 放 到 一 个 列表 中 ， 那 么 它 就 有 可 能 被 别 的 线程 发 
现 ， 这 时 候 需 要 首先 对 它 加 锁 。 

在 使 用 该 对 象 前 ， 线 程 需要 调用 foo_hold 对 这 个 对 象 的 引用 计数 加 
1。 当 对 象 使 用 完毕 时 ， 必 须 调用 foo_rele 释 放 引 用 。 最 后 一 个 引用 被 释 
放 时 ， 对 象 所 占 的 内 存 空间 就 被 释放 。 

在 这 个 例子 中 ， 我 们 忽略 了 线程 在 调用 foo_hold 之 前 是 如 何 找到 对 
象 的 。 如 果 有 另 一 个 线程 在 调用 foo_hold 时 阻塞 等 待 互 斥 锁 ， 这 时 即使 
该 对 象 引 用 计数 为 0，foo_rele 释 放 该 对 象 的 内 存 仍然 是 不 对 的 。 可 以 通 
过 确保 对 象 在 释放 内 存 前 不 会 被 找到 这 种 方式 来 避免 上 述 问 题 。 可 以 通 
过 下 面 的 例子 来 看 看 如 何 做 到 这 一 点 。 

















#include <stdlib.h> 
#include <pthread.h> 


struct foo { 


int f count; 
pthread_mutex_t f_lock; 

int f id; 

/* ... more stuff here ... */ 


}; 


struct foo * 
foo_alloc(int id) /* allocate the object */ 
{ 


struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp->f_count = 1; 
fp->f_id = id; 
if (pthread_mutex_init(&fp->f_lock, NULL) != 0) { 
free (fp); 
return (NULL); 
} 
/* ... continue initialization ... */ 
} 


return (fp) ; 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread_mutex_lock(&fp->f_lock) ; 

fp->f_count++; 

pthread_mutex_unlock (&fp->f_lock) ; 


void 
foo_rele(struct foo *fp) /* release a reference to the object */ 
{ 
pthread_mutex_lock (&fp->f_lock) ; 
if (--fp->f_count == 0) { /* last reference */ 
pthread_mutex_unlock (&fp->f_lock) ; 
pthread_mutex_destroy(&fp->f_lock) ; 
free (fp); 
} else { 
pthread_mutex_unlock (&fp->f_lock) ; 


图 11-10 使 用 互 斥 量 保护 数据 结构 





11.6.2 避 Ei 


WREAK ENERE MAAAR, MWA E AAR aA DE 
状态 ， 但 是 使 用 互 斥 量 时 ， 还 有 其 他 不 太 明 显 的 方式 也 能 产生 死 锁 。 例 
如 ， 程 序 中 使 用 一 个 以 上 的 互 斥 量 时 ， 如 果 人 允许 一 个 线程 一 直 占 有 第 一 
个 互 斥 量 ， 并 且 在 试图 锁 住 第 二 个 互 斥 量 时 处 于 阻塞 状态 ， 但 是 拥有 第 
二 个 互 斥 量 的 线程 也 在 试 岁 锁 住 第 一 个 互 太 量 。 因 为 两 个 线程 都 在 相互 
所 以 这 两 个 线程 都 无 法 回 前 运行 ， 于 是 就 
r” TM 。 

可 以 通过 仔细 控制 互 斥 量 加 锁 的 顺序 来 避免 死 锁 的 发 生 。 例 如 ， 假 
设 需 要 对 两 个 互 斥 量 A 和 B 同 时 加 锁 。 如 果 所 有 线程 总 是 在 对 互 斥 量 B 加 
锁 之 前 锁 住 互 斥 量 A， 那 么 使 用 这 两 个 互 斥 量 束 不 会 产生 死 锁 〈 当 然 在 
其 他 的 资源 上 仍 可 能 出 现 死 锁 ) 。 类 似 地 ， 如 果 所 有 的 线程 总 是 在 锁 住 
互 斥 量 A 之 前 锁 住 互 斥 量 B， 那 么 也 不 会 发 生死 锁 。 可 能 出 现 的 死 锁 只 
会 发 生 在 一 个 线程 试图 锁 住 另 一 个 线程 以 相反 的 顺序 锁 住 的 互 斥 量 。 

有 时 候 ， 应 用 程序 的 结构 使 得 对 互 斥 量 进行 排序 是 很 困难 的 。 如 果 
涉及 了 太 多 的 锁 和 数据 结构 ， 可 用 的 函数 并 不 能 把 它 转换 成 简单 的 层 
次 ， 那 么 就 需要 采用 另外 的 方法 。 在 这 种 情况 下 ， 可 以 先 释 放 占 有 的 
锁 ， 然 后 过 一 段 时 间 再 试 。 这 种 情况 可 以 使 用 pthread_mnutex_trylock 接 
口 避免 死 锁 。 如 果 已 经 占有 某 些 锁 而 且 pthread_mnutex_trylock 接 口 返 回 
成 功 ， 那 么 就 可 以 前 进 。 但 是 ， 如 果 不 能 获取 锁 ， 可 以 先 释放 已 经 占有 
的 锁 ， pees 然后 过 一 段 时 间 再 重新 试 。 

SE ppl 

在 这 个 例子 中 ， 我 们 更 新 了 图 11-10 的 程序 ， 展 示 了 两 个 互 斥 量 的 
使 用 方法 。 在 同时 需要 两 个 互 斥 量 时 ， 总 是 让 它们 以 相同 的 顺序 加 锁 ， 
这 样 可 以 避免 死 锁 。 第 二 个 互 斥 量 维护 着 一 个 用 于 跟踪 foo 数 据 结构 的 
散 列 列表 。 这 样 hashlock 互 斥 量 既 可 以 保护 foo 数 据 结构 中 的 散 列 表 也 ， 
又 可 以 保护 散 列 链 字 段 f_next。foo 结 构 中 的 f_lock 互 斥 量 保护 对 foo 结 构 
中 的 其 他 字段 的 访问 。 























include <stdlib.h> 
finclude <pthread.h> 


define NHASH 29 
#define HASH(id) (( (unsigned long) id) SNHASH) 


struct foo *f£h{NHASH]; 


pthread mutex_t hashlock = PTHREAD MUTEX INITIALIZER; 


struct foo { 


int f count; 

pthread_mutex_t f lock; 

int f id; 

struct foo * f next; /* protected by hashlock */ 
/* ... more stuff here ... */ 


struct foo * 
foo_alloc(int id) /* allocate the object */ 


| 


struct foo *fp; 
int idx; 


if ((fp = malloc(sizeof (struct foo))) != NULL) | 
fp->f_count = 1; 
fp->f id = id; 
if (pthread_mutex_init (&fp->f_lock, NULL) != 0) { 


free (fp); 
return (NULL) > 
} 
idx = HASH(id); 
pthread_mutex_lock (&hashlock) ; 
fp->f_next = fh[idx]; 
fh[idx] = fp; 
pthread_mutex_lock(&fp->f_lock); 
pthread_mutex_unlock (&hashlock) ; 
FE yes Continue initialization ses */ 
pthread_mutex_unlock (&fp->f_lock) ; 
} 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread_mutex_lock(&fp->f_lock); 

fp->f_count+t+; 

pthread_mutex_unlock (&fp->f_lLock) ; 


sbruct. foo * 
foo_find(int id) /* find an existing object */ 
{ 

struct: foo *fip; 


pthread_mutex_lock(&hashlock) ; 


for (fp = fhH[HASH(id)]; fp != NULL; fp = fp->f_next) { 
if (fp->£f iq == id) { 
foo hold (fp); 
break; 


} 
pthread_mutex_unlock (&hashlock) ; 


return (fp); 


void 
foo_rele(struct foo *fp) /* release a reference to the object */ 
{ 

struct foo ZEEP? 

int idx; 


pthread_mutex_lock (&fp->f_lock) ; 
if (fp->f_count == 1) { /* last reference */ 
pthread_mutex_unlock (&fp->f_lock) ; 
pthread_mutex_lock (&hashlock) ; 
pthread_mutex_lock (&fp->f_lock) ; 
/* need to recheck the condition */ 
if (fp=st count l= 1) + 
Ep->£_count--; 
pthread_mutex_unlock(&fp->f_lock) ; 
pthread_mutex_unlock (&hashlock) ; 


return; 
} 
/* remove from list */ 
idx = HASH(fp->f_id) ; 
tfp = fh{idx]; 
if (tip == fp) { 
fh[idx] = fp->f_next; 
} else { 
while (tfp->f next != fp) 
tip = tip->f_next; 
tfp->f_next = fp->f next; 
pthread mutex unlock (&hashlock) ; 
pthread _mutex_unlock(&fp->f_lock) ; 
pthread mutex destroy (&fp->f lock); 
free (fp); 
} else | 
fp->f_count--; 
pthread mutex unlock (&fp->f lock); 


图 11-11 使 用 两 个 互 斥 量 
比较 图 11-11 和 图 11-10， 可 以 看 出 ， 分 配 函 数 现 在 锁 住 了 散 列 列 
表 锁 ， 把 新 的 结构 添加 到 了 散 列 桶 中 ， 而 且 在 对 散 列 列表 的 锁 解 锁 之 
前 ， 先 锁定 了 新 结构 中 的 互 斥 量 。 因 为 新 的 结构 是 放 在 全 局 列表 中 的 ， 
其 他 线程 可 以 找到 它 ， 所 以 在 初始 化 完成 之 前 ， 需 要 阻塞 其 他 线程 试图 
访问 新 结构 。 
foo_find 函 数 锁 住 散 列 列表 锁 ， 然 后 搜索 被 请 求 的 结构 。 如 果 找 到 





了 ， 束 增加 其 引用 计数 并 返回 指 问 该 结构 的 指针 。 注 意 ， 加 锁 的 顺序 
是 ， 先 在 foo_find 函 数 中 锁定 散 列 列表 锁 ， 然 后 再 在 foo_hold 函 数 中 锁定 
foo 结 构 中 的 f lock FR. 

现在 有 了 两 个 锁 以 后 ，foo_rele 函 数 就 变 得 更 加 复杂 了 。 如 果 这 是 
最 后 一 个 引用 ， 融 需要 对 这 个 结构 互 斥 量 进行 解锁 ， 因 为 我 们 需要 从 散 
列 列表 中 删除 这 个 结构 ， 这 样 才 可 以 获取 散 列 列表 锁 ， 然 后 重新 获取 结 
构 互 斥 量 。 从 上 一 次 获得 结构 互 斥 量 以 来 我 们 可 能 被 阻塞 着 ， 所 以 需要 
重新 检查 条 件 ， 判 断 是 否 还 需要 释放 这 个 结构 。 如 果 另 一 个 线程 在 我 们 
为 满足 锁 顺 序 而 阻塞 时 发 现 了 这 个 结构 并 对 其 引用 计数 加 1， 那 么 只 需 
要 简单 地 对 整个 引用 计数 减 1， 对 所 有 的 东西 解锁 ， 然 后 返回 。 

这 种 锁 方 法 很 复杂 ， 所 以 我 们 需要 重新 审视 原来 的 设计 。 我 们 也 可 
以 使 用 散 列 列表 锁 来 保护 结构 引用 计数 ， 使 事情 大 大 简化 。 结 构 互 斥 量 
可 以 用 于 保护 foo 结 构 中 的 其 他 任何 东西 。 图 11-12 反 映 了 这 种 变化 。 

















#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 
#define HASH(id) (((unsigned long) id) NHASH) 


struct foo *fh(NHASH]; 
pthread mutex t hashlock = PTHREAD MUTEX INITIALIZER; 


struct foo { 
int f count; /* protected by hashlock */ 
pthread mutex t f lock; 


ant E Ade 
Struct E66 * f£ next>; /* protected by Hashbock */ 
ET «<= 和 Here sss */ 


struck Ego * 
Foo alloc(int id} /* allecate the object =y 


{ 


struct. foo PEDE 

ah g YA idazp 

if ((fp = malloc(sizeof(struct foo))) 1= NULL) { 
Ep->f£ count = 1; 
fp->fL_id = id; 
if (pthread_mutex_init (&fp->f_lock, NULL) != 0) 4 


free (fp) 2 
return (NULL) > 
} 
idx = HASH (id); 
pthread mutex_lock (&hashlock) > 
ff 二 让 下 next = fh [ads] + 
Eh [ites = ftps 
pthread_mutex_lock (&fp->f_lock) ; 
pthread mutex_unlock (&hashlock) > 
和 
pthread_mutex_unlock (&fp—->f_lock) ; 
} 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex_lock (&hashlock) ; 

£p—SL_ Count++; 

pthread _mutex_unlock (&hashlock) :> 


SEzuct Loo = 
foo_find(int id) /* Tind an existing object wy 


{ 
Struct. Eso PEPY 


pthread mutex lock (Shashlock) > 
for (fp = fh [HASH (id) ls fp != NULL; fp = fp->f_next) 4 
LE (Ep-—SE_id- == td: + 
fps Counts 
break; 


} 
pthread _mutex_unlock (&hashlock) > 


return (fp); 


void 


foo rele (struct foo *fp) /* release a reference to the object */ 
| 

struct foo *tfp; 

int idx; 


pthread_mutex lock (&hashlock) ; 
if (--fp->f count == 0) { /* last reference, remove from list */ 
idx = HASH(fp->f_id); 
tfp = fh{idx]; 
if (tip == fp) | 
fh{idx] = fp->f next; 
} else { 
while (tfp->f next != fp) 
tfp = tfp->f next; 
tfp->f next = fp->f_next; 
pthread_mutex_unlock (&hashlock) ; 
pthread mutex destroy (&fp->f lock) ; 
free (fp); 
} else { 
pthread mutex_unlock (&hashlock) ; 


图 11-12 简化 的 锁 
注意 ， 与 图 11-11 中 的 程序 相 比 ， 图 11-12 中 的 程序 就 简单 多 了 。 两 
种 用 途 使 用 相同 的 锁 时 ， 围 经 散 列 列表 和 引用 计数 的 锁 的 排序 问题 就 不 
存在 了 。 多 线程 的 软件 设计 涉及 这 两 者 之 间 的 折 中 。 如 果 锁 的 粒度 太 
粗 ， 就 会 出 现 很 多 线程 阻塞 等 竺 相同 的 锁 ， 这 可 能 并 不 能 改善 并 发 性 。 


如 果 锁 的 粒度 太 细 ， 那 么 过 多 的 锁 开 销 会 使 系统 性 能 受到 影响 ， 而 且 代 
码 变 得 复杂 。 作 为 一 个 程序 员 ， 需 要 在 满足 锁 需 求 的 情况 下 ， 在 代码 复 
杂 性 和 性 能 之 间 找 到 正确 的 平衡 。 


11.6.3 负数 pthread mutex timedlock 


当 线 程 试 图 获取 一 个 已 加 锁 的 互 斥 量 时 ，pthread_mnutex_timedlock 
互 斥 量 原 语 允 许 绑 定 线程 阻塞 时 间 。pthread_mutex_timedlock 函 数 与 
pthread_mnutex_lock 有 是 基本 等 价 的 ， 但 是 在 达到 超时 时 间 值 时 ， 
pthread_mutex_timedlock 不 会 对 互 斥 量 进行 加 锁 ， 而 是 返回 错误 码 
ETIMEDOUT. 

#include <pthread.h> 

#include <time.h> 

int pthread_mutex_timedlock(pthread_mutex_t *restrict mutex, 

const struct timespec *restrict tsptr); 
返回 值 : 知 成 功 ， 返 回 0; 人 否则， 返回 错误 编号 

超时 指定 愿意 等 竺 的 绝对 时 间 《 与 相对 时 间 对 比 而 言 ， 指 定 在 时 间 
X 之 前 可 以 阻塞 等 待 ， 而 不 是 说 愿意 阻塞 Y 秒 ) 。 这 个 超时 时 间 是 用 
构 来 表示 的 ， 它 用 秒 和 纳 秒 来 描述 时 间 。 

实例 

图 11-13 给 出 了 如 何 用 pthread_mnutex_timedlock 避 免 永 久 阻塞 。 














finclude "apue.h" 
include <pthread.h> 


int 
main (void) 
| 
int err; 
struct timespec tout; 
struct tm *tmp; 
char buf [64]; 
pthread_mutex_t lock = PTHREAD MUTEX_INITIALIZER; 


pthread_mutex_lock (élock) ; 
printf ("mutex is locked\n"); 
clock gettime (CLOCK REALTIME, &tout) ; 
tmp = localtime(&tout.tv_sec) ; 
strftime(buf, sizeof(buf), "sr", tmp); 
printf ("current time is %s\n", buf); 
tout,tv sec += 10; /* 10 seconds from now */ 
/* caution: this could lead to deadlock */ 
err = pthread _mutex_timedlock(&lock, &tout) ; 
clock gettime (CLOCK REALTIME, &tout); 
tmp = localtime(&tout.tv_sec) ; 
strftime (buf, sizeof(buf), "sr", tmp); 
printf ("the time is now $s\n", buf); 
if (err == 0) 

printf ("mutex locked again!\n"); 
else 

printf ("can't lock mvtex again:%s\n",strerror (err) ); 
exit (0); 


图 11-13 使 用 pthread_mutex_timedlock 

图 11-13 中 的 程序 运行 结果 输出 如 下 : 

$ ./a.out 

mutex is locked 

current time is 11:41:58 AM 

the time is now 11:42:08 AM 

can’t lock mutex again: Connection timed out 

这 个 程序 故意 对 它 已 有 的 互 斥 量 进行 加 锁 ， 目 的 是 演示 
pthread_mnutex_timedlock 是 如 何 工作 的 。 不 推荐 在 实际 中 使 用 这 种 策 
略 ， 因 为 它 会 导致 死 锁 。 

注意 ， 阻 窗 的 时 间 可 能 会 有 所 不 同 ， 造 成 不 同 的 原因 有 多 种 : 开始 
时 间 可 能 在 某 秒 的 中 间 位 置 ， 系 统 时 钟 的 精度 可 能 不 足以 精确 到 支持 我 
E i 超时 时 间 值 ， 或 者 在 程序 继续 运行 前 ， 调 度 延 到 可 能 会 增加 时 
间 值 。 

Mac OS X 10.6.8 还 没有 文 持 pthread_mutex_timedlock， 但 是 
FreeBSD 8.0, Linux 3.2.0 以 及 Solaris 10 支 持 该 函数 ， 虽 然 Solaris 仍 然 把 
它 放 在 实时 库 librt 中 。Solaris 10 还 提供 了 另 一 个 使 用 相对 超时 时 间 的 函 
数 。 








11.6.4 读 写 锁 


读 写 锁 Creader-writer lock) 与 互 斥 量 类 似 ， 不 过 读 写 锁 允 许 更 高 的 
并 行 性 。 互 斥 量 要 么 是 锁 住 状态 ， 要 么 束 是 不 加 锁 状 态 ， 而 有 旦 一 次 只 有 
一 个 线程 可 以 对 其 加 锁 。 读 写 锁 可 以 有 3 种 状态 : 读 模 式 下 加 锁 状 态 ， 
写 模 式 下 加 锁 状 态 ， 不 加 锁 状 态 。 一 次 只 有 一 个 线程 可 以 占有 写 模式 的 
读 写 锁 ， 但 是 多 个 线程 可 以 同时 占有 读 模 式 的 读 写 锁 。 

当 读 写 锁 是 写 加 锁 状 态 时 ， 在 这 个 锁 被 解锁 之 前 ， 所 有 试图 对 这 个 
锁 加 锁 的 线程 都 会 被 阻塞 。 当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 读 模 
式 对 它 进 行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 是 任何 希望 以 写 模 式 对 此 
锁 进 行 加 锁 的 线程 都 会 阻塞 ， 直 到 所 有 的 线程 释放 它们 的 读 锁 为 止 。 虽 
然 各 操作 系统 对 读 写 锁 的 实现 各 不 相同 ， 但 当 读 写 锁 处 于 读 模 式 锁 住 的 
状态 ， 而 这 时 有 一 个 线程 试图 以 写 模式 获取 锁 时 ， 读 写 锁 通 党 会 阻塞 随 
后 的 读 模 式 锁 请 求 。 这 样 可 以 避免 读 模 式 锁 长 期 占用 ， 而 等 待 的 写 模式 
锁 请 求 一 直 得 不 到 满足 。 

读 写 锁 非 常 适合 于 对 数据 结构 读 的 次 数 远 大 于 写 的 情况 。 当 读 写 锁 
在 写 模 式 下 时 ， 它 所 保护 的 数据 结构 就 可 以 被 安全 地 修改 ， 因 为 一 次 只 
有 一 个 线程 可 以 在 写 模 式 下 拥有 这 个 锁 。 当 读 写 锁 在 读 模式 下 时 ， 只 要 











线程 先 获 取 了 读 模 式 下 的 读 写 锁 ， 该 锁 所 保护 的 数据 结构 就 可 以 被 多 个 
获得 读 模 式 锁 的 线程 读 取 。 

读 写 锁 也 叫做 共享 互 斥 锁 Cshared-exclusive lock) 。 当 读 写 锁 是 读 
模式 锁 住 时 ， 就 可 以 说 成 是 以 共享 模式 锁 住 的 。 当 它 是 写 模式 锁 住 的 时 
候 ， 融 可 以 说 成 是 以 互 斥 模式 锁 住 的 。 

与 互 斥 量 相 比 ， 读 写 锁 在 使 用 之 前 必须 初始 化 ， 在 释放 它们 底层 的 
内 存 之 前 必须 销 师 。 

#include <pthread.h> 

int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, 

const pthread_rwlockattr_t *restrict attr); 

int pthread_rwlock_destroy(pthread_rwlock_t *rwlock); 

两 个 函数 的 返回 值 : 大 成 功 ， 返 回 0; 否则， 返回 错误 编号 

读 写 锁 通 过 调用 pthread_rwlock_init 进行 初始 化 。 如 果 和 希望 读 写 锁 
有 默认 的 属性 ， 可 以 传 一 个 null 指 针 给 attr， 我 们 将 在 12.4.2 节 中 讨论 读 
写 锁 的 属性 。 

Single UNIX Specification 在 XSI 扩 展 中 定义 了 
PTHREAD_RWLOCK_INITIALIZER 和 常量。 如 果 默 认 属 性 就 足够 的 话 ， 
可 以 用 它 对 静态 分 配 的 读 写 锁 进 行 初始 化 。 

在 释放 读 写 锁 占用 的 内 存 之 前 ， 需 要 调用 pthread_rwlock_destroy 
做 清理 工作 。 如 果 pthread_rwlock_init 为 读 写 锁 分 配 了 资源 ， 
pthread_rwlock_destroy 将 释放 这 些 资源 。 如 果 在 调用 
pthread_rwlock_destroy 之 前 束 释 放 了 读 写 锁 占用 的 内 存 空间 ， 那 么 分 配 
给 这 个 锁 的 资源 就 会 去 失 。 

要 在 读 模 式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_rdlock。 要 在 
写 模 式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_wrlock。 不 管 以 何 种 方 
式 锁 住 读 写 锁 ， 都 可 以 调用 pthread_rwlock_unlock 进 行 解 锁 。 

#include <pthread.h> 

int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock); 

int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock); 

int pthread_rwlock_unlock(pthread_rwlock_t *rwlock); 

所 有 函数 的 返回 值 ， 夺 成功， 返回 0; 否则， 返回 错误 编号 

各 种 实现 可 能 会 对 共享 模式 下 可 获取 的 读 写 锁 的 次 数 进行 限制 ， 所 
以 需要 检查 pthread_rwlock_rdlock 的 返回 值 。 即 使 pthread_rwlock_wrlock 
和 pthread_rwlock_unlock 有 错误 返回 ， 而 且 从 技术 上 来 讲 ， 在 调用 函数 
时 应 该 总 是 检查 错误 返回 ， 但 是 如 采 锁 设计 合理 的 话 ， 就 不 需要 检查 它 
们 。 错 误 返 回 值 的 定义 只 是 针对 不 正确 使 用 读 写 锁 的 情况 《如 未 经 初始 
化 的 锁 ) ， 或 者 试图 获取 己 拥 有 的 锁 从 而 可 能 产生 死 锁 的 情况 。 但 是 需 














要 注意 ， 有 些 特 定 的 实现 可 能 会 定义 另外 的 错误 返回 。 

Single UNIX Specification 还 定义 了 读 写 锁 原 语 的 条 件 版 本 。 

#include <pthread.h> 

int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock); 

int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock); 

两 个 函数 的 返回 值 : 大 成 功 ， 返 回 0; 否则， 返回 错误 编号 

可 以 获取 锁 时 ， 这 两 个 函数 返回 0。 和 否则 ， 它 们 返回 错误 EBUSY 。 
这 两 个 函数 可 以 用 于 我 们 前 面 讨论 的 遵守 某 种 锁 层 次 但 还 不 能 完全 避免 
死 锁 的 情况 。 

实例 

图 11-14 中 的 程序 解释 了 读 写 锁 的 使 用 。 作 业 请 求 队列 由 单个 读 写 
锁 保 护 。 这 个 例子 给 出 了 图 11-1 所 示 的 一 种 可 能 的 实现 ， 多 个 工作 线程 
获取 单个 主线 程 分 配给 它们 的 作业 。 











#include <stdlib.h> 
#include <pthread.h> 


struct job { 
struct job *j_next; 
struct job *}_prev; 
pthread_t j_id; /* tells which thread handles this job */ 
/* ... more stuff here ... */ 


i 


struct queue { 
struct job *q head; 
struct job *q tail; 
pthread_rwlock_t q_lock; 
}; 


/* 

* Initialize a queue, 

int 

queue init (struct queue *qp) 
{ 


int err; 


qp->q_head = NULL; 
qp->q_tail = NULL; 
err = pthread_rwlock_init (&qp->q_lock, NULL); 
if (err != 0) 
return (err); 
/* „ao continue initialization ... */ 
return (0); 


/* 
* Insert a job at the head of the queue. 
| 


void 


job_insert (struct queue *qp, 


{ 


/* 


struct. job *Jp) 


pthread_rwlock_wrlock (&qp->q_lock) ; 
jp->j_next = qp->q_head; 


jp->j_prev = NULL; 

if (qp->q_head != NULL) 
qp->q_head->j_prev 

else 


qp->q_tail = jp; /* 


qp->q_head = jp; 


IPF 


list was empty */ 


pthread_rwlock_unlock (&qp->q_lock) ; 


* Append a job on the tail of the queue. 


wf 


void 


job_append (struct queue *qp, 


{ 


/* 


Strut. Job ye) 


pthread_rwlock_wrlock (&qp->q_lock) > 


jp->j_next = NULL; 
jp->j_prev = qp->q tail 
if (qp->q_tail != NULL) 

qp->q_tail->j_next 
else 


gp->q head = jpe /* 


qp->q tail = jp; 


r 


jp? 


list was empty */ 


pthread_rwlock_unlock (&qp->q_lock); 


* Remove the given job from a queue. 


EFA 
void 


job_remove (struct queue *qp, 


{ 


struct job *jp) 


pthread_rwlock_wrlock (&qp->q_lock) ; 


| 


if (jp == qp->q_head) { 


qp->q_head = jp->j_next; 


if (qp->q_tail == jp) 


qp->q_tail = NULL; 


else 


jp->j_next->j_prev = jp->j_prev; 
} else if (jp == qp->q tail) { 
qp->q_tail = jp->j_prev; 


jp->j_prev->j_next 
} else { 

jp->j_prev->j_next 

jp->j_next->j_prev 
} 


Jp-xj-next; 


jp->j_next; 
jp->j_prev; 


pthread_rwlock_unlock (&qp->q_lock) ; 


* Find a job for the given thread ID. 
ay 

struct job * 

job_find(struct queue *qp, pthread_t id) 


| 
struct job *]p; 


if (pthread rwlock rdlock(&gp->q lock) != 0) 
return (NULL) ; 


for (jp = qp->q head; jp != NULL; jp = jp->j_next) 
1f (pthread_equal(jp->7_1d, id)) 
break; 


pthread_rwlock unlock (&qp->q lock) ; 
return (jp); 


图 11-14 使 用 读 写 锁 

在 这 个 例子 中 ， 几 是 需要 同 队列 中 增加 作业 或 者 从 队列 中 删除 作业 
的 时 候 ， 都 采用 了 写 模 式 来 锁 住 队列 的 读 写 锁 。 不 管 何 时 搜索 队列 ， 都 
需要 获取 读 模 式 下 的 锁 ， 人 允许 所 有 的 工作 线程 并 发 地 搜索 队列 。 在 这 种 
情况 下 ， 只 有 在 线程 搜索 作业 的 频率 远 远 高 于 增加 或 删除 作业 时 ， 使 用 
读 写 锁 才 可 能 改善 性 能 。 

工作 线程 只 能 从 队列 中 读 取 与 它们 的 线程 ID 匹配 的 作业 。 由 于 作 
业 结 构 同 一 时 间 只 能 由 一 个 线程 使 用 ， 所 以 不 需要 额外 的 加 锁 。 


11.6.5 77 A EBAY se E i 





与 互 斥 量 一 样 ，Single UNIX Specification 提 供 了 带 有 超时 的 读 写 锁 
加 锁 函 数 ， 使 应 用 程序 在 获取 读 写 锁 时 避免 陷入 永久 阻塞 状态 。 这 两 个 


函数 是 pthread_rwlock_timedrdlock 和 pthread_rwlock_timedwrlock. 
#include <pthread.h> 
#include <time.h> 
int pthread_rwlock_timedrdlock(pthread_rwlock_t *restrict rwlock, 
const struct timespec *restrict tsptr); 
int pthread_rwlock_timedwrlock(pthread_rwlock_t *restrict rwlock, 
const struct timespec *restrict tsptr); 
两 个 函数 的 返回 值 ， 大 成功， 返回 9; 否则， 返回 错误 编号 
这 两 个 函数 的 行为 与 它们 “不 计时 的 ”版 本 类 似 。tsptr 参 数 指 问 
timespec 结 构 ， 指 定 线程 应 该 停止 阻塞 的 时 间 。 如 果 它 们 不 能 获取 锁 ， 
那么 超时 到 期 时 ， 这 两 个 函数 将 返回 ETIMEDOUT 错 误 。 与 
pthread_mutex_timedlock 函 数 类 似 ， 超 时 指定 的 是 绝对 时 间 ， 而 不 是 相 
对 时 间 。 








11.6.6 条 件 变 量 


条 件 变 量 是 线程 可 用 的 另 一 种 同步 机 制 。 条 件 变量 给 多 个 线程 提供 
了 一 个 会 合 的 场所 。 条 件 变量 与 互 斥 量 一 起 使 用 时 ， 人 允许 线程 以 无 竞争 
的 方式 等 竺 特定 的 条 件 发 生 。 

条 件 本 喘 是 由 互 斥 量 保护 的 。 线 程 在 改变 条 件 状 态 之 前 必须 首 移 锁 
住 互 斥 量 。 其 他 线程 在 获得 互 斥 量 之 前 不 会 察觉 到 这 种 改变 ， 因 为 互 斤 
量 必须 在 锁定 以 后 才能 计算 条 件 。 

在 使 用 条 件 变 量 之 前 ， 必 须 先 对 它 进行 初始 化 。 由 pthread_cond_t 
数据 类 型 表示 的 条 件 变 量 可 以 用 两 种 方式 进行 初始 化 ， 可 以 把 常量 
PTHREAD_COND_INITIALIZER 赋 给 静态 分 配 的 条 件 变 量 ， 但 是 如 果 
条 件 变 量 古 动 态 分 配 的 ， 则 需要 使 用 pthread_cond_init 岗 数 对 它 进行 亿 
始 化 。 

在 释放 条 件 变 量 底层 的 内 存 空间 之 前 ， 可 以 使 用 
pthread_cond_destroy 函 数 对 条 件 变 量 进行 反 初 始 化 (deinitialize〉。 

#include <pthread.h> 

int pthread_cond_init(pthread_cond_t *restrict cond, 

const pthread_condattr_t *restrict attr); 

int pthread_cond_destroy(pthread_cond_t *cond); 

两 个 函数 的 返回 值 ， ARI, TRIO; 否则， 返回 错误 编号 

除非 雷 要 创建 一 个 具有 非 默 认 属 性 的 条 件 变 量 ， 盏 则 
pthread_cond_init 函 数 的 attr 参 数 可 以 设置 为 NULL。 我 们 将 在 12.4.3 节 中 
讨论 条 件 变量 属性 。 




















我 们 使 用 pthread_cond_wait 等 待 条 件 变 量变 为 真 。 如 果 在 给 定 的 时 
间 内 条 件 不 能 满足 ， 那 么 会 生成 一 个 返回 错误 码 的 变量 。 

#include <pthread.h> 

int pthread_cond_wait(pthread_cond_t *restrict cond, 

pthread_mutex_t *restrict mutex); 
int pthread_cond_timedwait(pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex, 
const struct timespec *restrict tsptr); 
PAT PRAIRIE: ARH, eo; 否则， 返回 错误 编号 

传递 给 pthread_cond_wait 的 互 斥 量 对 条 件 进 行 保 护 。 调 用 者 把 锁 住 
的 互 斥 量 传 给 函数 ， 函 数 然后 自动 把 调用 线程 放 到 等 待 条 件 的 线程 列表 

上 ， 对 互 斥 量 解锁 。 这 就 关闭 了 条 件 检查 和 线程 进入 休眠 状态 等 待 条 件 
改变 这 两 个 操作 之 间 的 时 间 通 道 ， 这 样 线程 束 不 会 错过 条 件 的 任何 变 
化 。pthread_cond_wait 返 回 时 ， 互 斥 量 再 次 被 锁 住 。 

pthread_cond_timedwait 函 数 的 功能 与 pthread_cond_wait 函 数 相似 ， 
只 是 多 了 一 个 超时 Ctsptr) 。 超 时 值 指 定 了 我 们 愿意 等 待 多 长 时 间 ， 它 
是 通过 timespec 结 构 指 定 的 。 

如 图 11-13 所 示 ， 需 要 指定 愿意 等 待 多 长 时 间 ， 这 个 时 间 值 是 一 个 
绝对 数 而 不 是 相对 数 。 人 例如， 假设 愿意 等 待 3 分 钟 。 那 么 ， 并 不 是 把 3 分 
钟 转 换 成 timespec 结 构 ， 而 是 需要 把 当前 时 间 加 上 3 分 钟 再 转换 成 
timespec 结 构 。 

可 以 使 用 clock_gettime 函 数 〈 见 6.10 节 ) 获取 timespec 结 构 表 示 的 当 
前 时 间 。 但 是 目前 并 不 是 所 有 的 平台 都 文 持 这 个 函数 ， 因 此 ， 也 可 以 用 
另 一 个 函数 gettimeofday 获取 timeval 结 构 表示 的 当前 时 间 ， 然 后 把 这 个 
时 间 转 换 成 timespec 结 构 。 要 得 到 超时 值 的 绝对 时 间 ， 可 以 使 用 下 面 的 
函数 (假设 阻 窜 的 最 大 时 间 使 用 分 来 表示 的 〉: 

#include <sys/time.h> 

#include <stdlib.h> 

void 

maketimeout(struct timespec *tsp, long minutes) 
{ 

struct timeval now; 

/* get the current time */ 

gettimeofday(&now, NULL); 

tsp->tv_sec = now.tv_sec; 

tsp->tv_nsec = now.tv_usec * 1000; /* usec to nsec */ 
/* add the offset to get timeout value */ 











tsp->tv_sec += minutes * 60; 


} 

如 果 超 时 到 期 时 条 件 还 是 没有 出 现 ，pthread_cond_timewait 将 重新 
获取 互 斥 量 ， 然 后 返回 错误 ETIMEDOUT。 从 pthread_cond_wait 或 者 
pthread_cond_timedwait 调 用 成 功 返 回 时 ， 线 程 需要 重新 计算 条 件 ， 因 为 
另 一 个 线程 可 能 已 经 在 运行 并 改变 了 条 件 。 

有 两 个 函数 可 以 用 于 通知 线程 条 件 已 经 满足 。pthread_cond_signal 
函数 至 少 能 唤醒 一 个 等 待 该 条 件 的 线程 ， 而 pthread_cond_broadcast 函 数 
则 能 唤醒 等 待 该 条 件 的 所 有 线程 。 

POSIX 规范 为 了 简化 pthread_cond_signal 的 实现 ， 人 允许 它 在 实现 的 
时 候 唤 醒 一 个 以 上 的 线程 。 

#include <pthread.h> 

int pthread_cond_signal(pthread_cond_t *cond); 

int pthread_cond_broadcast(pthread_cond_t *cond); 

两 个 函数 的 返回 值 : ARJ, GRO; 人 否则， 返回 错误 编号 

在 调用 pthread_cond_signal 或 者 pthread_cond_broadcast 时 ， 我 们 说 这 
是 在 给 线程 或 者 条 件 发 信号 。 必 须 注意 ， 一 定 要 在 改变 条 件 状 态 以 后 再 
给 线程 发 信和 号。 

实例 

图 11-15 给 出 了 如 何 络 合 使 用 条 件 变 量 和 互 斥 量 对 线程 进行 同步 。 




















finclude <pthread.h> 


struct msg { 
struct msg *m next; 
/* ,,, more stuff here ,,, */ 


struct msg *workq; 


pthread_cond_t qready = PTHREAD COND_INITIALIZER; 


pthread mutex t glock = PTHREAD MUTEX_INITIALIZER; 


void 
process msg (void) 
| 


struct msg *mp; 


for (77) { 
pthread_mutex lock (&qlock) ; 
while (workg == NULL) 
pthread cond wait (&qready, &qlock); 


mp = workq; 

worka = mp->m next; 

pthread mutex unlock (&qlock) ; 

/* now process the message mp */ 


void 

enqueue msg (struct msg *mp) 

| 
pthread mutex lock (&qlock) ; 
mp->m_next = workq; 
workg = mp; 
pthread_mutex_unlock (&qlock) ; 
pthread_cond signal (&qready) ; 


图 11-15 使 用 条 件 变 量 
条 件 是 工作 队列 的 状态 。 我 们 用 互 斥 量 保护 条 件 ， 在 while 循环 中 
判断 条 件 。 把 消息 放 到 工作 队列 时 ， 需 要 占有 互 斥 量 ， 但 在 给 等 待 线程 
发 信号 时 ， 不 需要 占有 互 斥 量 。 只 要 线程 在 调用 pthread_cond_signal 之 
前 把 消息 从 队列 中 拖 出 了 ， 束 可 以 在 释放 互 斥 量 以 后 完成 这 部 分 工作 。 
因为 我 们 是 在 while 循环 中 检查 条 件 ， 所 以 不 存在 这 样 的 问题 : 线程 醒 
来 ， 发 现 队列 仍 为 室 ， 然 后 返回 继续 等 待 。 如 果 代 码 不 能 容忍 这 种 竞 
争 ， 就 需要 在 给 线程 发 信号 的 时 候 占 有 互 斥 量 。 


11.6.7 É jie fii 
目 旋 锁 与 互 斥 量 类 似 ， 但 它 不 是 通过 休眠 使 进程 阻塞 ， 而 是 在 获取 


锁 之 前 一 直人 处 于 忙 等 (上 自 旋 ) 阻塞 状态 。 目 旋 锁 可 用 于 以 下 情况 : 锁 被 
持 有 的 时 间 短 ， 而 且 线 程 并 不 希望 在 重新 调度 上 花费 太 多 的 成 本 。 









































目 旋 锁 通 常 作 为 底层 原 语 用 于 实现 其 他 关 型 的 锁 。 根 据 它 们 所 基于 
的 系统 体系 结构 ， 可 以 通过 使 用 测试 并 设置 指令 有 效 地 实现 。 当 然 这 里 
说 的 有 效 也 还 是 会 导致 CPU 资 源 的 浪费 当 线 程 目 旋 等 竺 锁 变 为 可 用 
E E ae eo ye 
原因 。 

当 自 旋 锁 用 在 非 抢占 式 内 核 中 时 是 非常 有 用 的 : 除了 提供 互 斥 机 制 
以 外 ， 它 们 会 阻塞 中 断 ， 这 样 中 断 处 理 程 序 就 不 会 让 系统 陷入 死 锁 状 
态 ， 因 为 它 需 要 获取 已 被 加 锁 的 目 旋 锁 〈 把 中 断想 成 是 刃 一 种 抢占 ) 。 
在 这 种 类 型 的 内 核 中 ， 中 断 处 理 程序 不 能 休眠 ， 因 此 它们 能 用 的 同步 原 
语 只 能 是 目 旋 锁 。 

但 是 ， 在 用 户 层 ， 目 旋 锁 并 不 是 非常 有 用 ， 除 非 运行 在 不 允许 抢 操 
的 实时 调度 关中。 运行 在 分 时 调度 类 中 的 用 户 层 线程 在 两 种 情况 下 可 以 
被 取消 调度 : 当 它 们 的 时 间 片 到 期 时 ， 或 者 具有 更 高 调度 优先 级 的 线程 
就 绪 变 成 可 运行 时 。 在 这 些 情况 下 ， 如 果 线 程 拥 有 目 旋 锁 ， 它 就 会 进入 
休眠 状态 ， 阻 竖 在 锁 上 的 其 他 线程 目 旋 的 时 间 可 能 会 比 预期 的 时 间 更 
F 


很 多 互 斥 量 的 实现 非常 高 效 ， 以 至 于 应 用 程序 采用 互 斥 锁 的 性 能 与 
曾经 采用 过 自 旋 锁 的 性 能 基本 是 相同 的 。 事 实 上 ， 有 些 互 斥 量 的 实现 在 
试图 获取 互 斥 量 的 时 候 会 自 旋 一 小 段 时 间 ， 只 有 在 上 自 旋 计数 到 达 某 一 阔 
值 的 时 候 才 会 休眠 。 这 些 因素 ， 加 上 现代 处 理 吉 的 进步 ， 使 得 上 下 文 切 
换 越 来 越 快 ， 也 使 得 自 旋 锁 只 在 某 些 特定 的 情况 下 有 用 。 

自 旋 锁 的 接口 与 互 斥 量 的 接口 类 似 ， 这 使 得 它 可 以 比较 容易 地 从 一 
个 蔡 换 为 另 一 个 。 可 以 用 pthread_spin_init 函数 对 上 自 旋 锁 进 行 初 始 化 。 
用 pthread_spin_destroy 函数 进行 自 旋 锁 的 反 初 始 化 。 

#include <pthread.h> 

int pthread_spin_init(pthread_spinlock_t *lock, int pshared); 

int pthread_spin_destroy(pthread_spinlock_t *lock); 

两 个 函数 的 返回 值 : A, JRO; 否则 ， 返 回 错误 编号 

只 有 一 个 属性 是 自 旋 锁 特 有 的 ， 这 个 属性 只 在 文 持 线程 进程 共享 同 
+44 (Thread Process-Shared Synchronization) 选项 (这 个 选项 目前 在 
Single UNIX Specification 中 是 强制 的 ， 见 图 2-5) 的 平台 上 才 用 得 到 。 
pshared ”参数 表示 进程 共享 属性 ， 表 明 目 旋 锁 是 如 何 获取 的 。 如 采 它 设 
为 PTHREAD_PROCESS_SHARED， 则 自 旋 锁 能 被 可 以 访问 锁 底层 内 存 
的 线程 所 获取 ， 即 便 那 些 线程 属于 不 同 的 进程 ， 情 况 也 是 如 此 。 人 否则 
pshared 参 数 设 为 ”PTHREAD_PROCESS_PRIVATE， 自 旋 锁 就 只 能 被 初 
始 化 该 锁 的 进程 内 部 的 线程 所 访问 。 

可 以 用 pthread_spin_lock 或 pthread_spin_trylock 对 自 旋 锁 进行 加 锁 ， 



































前 者 在 获取 锁 之 前 一 直 自 旋 ， 后 者 如 果 不 能 获取 锁 ， 就 立即 返回 
EBUSY 错误 。 注 意 ，pthread_spin_trylock 不 能 自 旋 。 不 管 以 何 种 方式 加 
锁 ， 自 旋 锁 都 可 以 调用 pthread_spin_unlock 函 数 解锁 。 

#include <pthread.h> 

int pthread_spin_lock(pthread_spinlock_t *lock); 

int pthread_spin_trylock(pthread_spinlock_t *lock); 

int pthread_spin_unlock(pthread_spinlock_t *lock); 

所 有 函数 的 返回 值 ， 夺 成功， 返回 90; 否则， 返回 错误 编号 

注意 ， 如 果 上 自 旋 锁 当 前 在 解锁 状态 的 话 ，pthread_spin_lock 函 数 不 
要 自 旋 就 可 以 对 它 加 锁 。 如 果 线 程 已 经 对 它 加 锁 了 ， 结 果 就 是 未 定义 
的 。 调 用 pthread_spin_lock 会 返回 EDEADLK 错 误 (或 其 他 错误 ) ， 或 者 
调用 可 能 会 永久 上 自 旋 。 具 体 行为 依赖 于 实际 的 实现 。 试 图 对 没有 加 锁 的 
自 旋 锁 进行 解锁 ， 结 果 也 是 未 定义 的 。 

不 管 是 pthread_spin_lock 还 是 pthread_spin_trylock， 返 回 值 为 0 的 话 
就 表示 自 旋 锁 被 加 锁 。 需 要 注意 ， 不 要 调用 在 持 有 上 自 旋 锁 情况 下 可 能 会 
进入 休眠 状态 的 函数 。 如 果 调 用 了 这 些 函 数 ， 会 浪费 CPU 资 源 ， 因 为 其 
他 线程 需要 获取 目 旋 锁 需 要 等 待 的 时 间 就 延长 了 。 


11.6.8 屏障 


屏障 (barrier) 是 用 户 协 调 多 个 线程 并 行 工 作 的 同步 机 制 。 屏 障 允 
许 每 个 线程 等 等 ， 直 到 所 有 的 合作 线程 都 到 达 某 一 点 ， 然 后 从 该 点 继续 
执行 。 我 们 已 经 看 到 一 种 屏障 ，pthread_join 函 数 就 是 一 种 屏障 ， 人 允许 一 
个 线程 等 待 ， 直 到 另 一 个 线程 退出 。 
但 是 屏障 对 象 的 概念 更 广 ， 它 们 允许 任意 数量 的 线程 等 待 ， 直 到 所 
ee 而 线程 不 需要 退出 。 所 有 线程 达到 屏障 后 可 以 
ZA THE 
可 以 使 用 pthread_barrier_init 函数 对 屏障 进行 初始 化 ， 用 
thread_barrier_destroy 函 数 反 初始 化 。 
#include <pthread.h> 
int pthread_barrier_init(pthread_barrier_t *restrict barrier, 
const pthread_barrierattr_t *restrict attr, 
unsigned int count); 
int pthread_barrier_destroy(pthread_barrier_t *barrier); 
两 个 函数 的 返回 值 : ARD, TRIO; 否则， 返回 错误 编号 
初始 化 屏障 时 ， 可 以 使 用 count 参 数 指定 ， 在 允许 所 有 线程 继续 运 
行 之 前 ， 必 须 到 达 屏 障 的 线程 数目 。 使 用 attr 参 数 指定 屏障 对 象 的 属 











性 ， 我 们 会 在 下 一 章 详细 讨论 。 现 在 设置 attr 为 NULL， 用 默认 属性 初始 
化 屏障 。 如 果 使 用 pthread_barrier_init 函 数 为 屏障 分 配 资源 ， 那 么 在 反 初 
et, Be bes Nf AY LA val H pthread_barrier_destroy R 20 £4 BAH DAY BER o 

可 以 使 用 pthread_barrier wait 函数 来 表明 ， 线 程 已 完成 工作 ， 准 备 
等 所有 其 他 线程 赶 上 来 。 

#include <pthread.h> 

int pthread_barrier_wait(pthread_barrier_t *barrier); 

返回 值 : ae 返回 0 或 者 
PTHREAD_BARRIER_SERIAL_THREAD; 和 否则， 返回 错误 编号 

调用 pthread_barrier_wait 的 线程 在 屏障 计数 〈 调 用 
pthread_barrier_init 时 设 定 ) 未 满足 条 件 时 ， 会 进入 休眠 状态 。 如 果 该 线 
程 是 最 后 一 个 调用 pthread_barrier_wait 的 线程 ， 就 满足 了 屏障 计数 ， 所 
有 的 线程 都 被 唤醒 。 

对 于 一 个 任意 线程 ，pthread_barrier_wait 函 数 返 回 了 
PTHREAD_BARRIER_SERIAL_THREAD。 剩 下 的 线程 看 到 的 返回 值 是 
0。 这 使 得 一 个 线程 可 以 作为 主线 程 ， 它 可 以 工作 在 其 他 所 有 线程 已 完 
成 的 工作 结果 上 。 

一 旦 达到 屏障 计数 值 ， 而 且 线程 处 于 非 阻塞 状态 ， 屏 障 就 可 以 被 重 
用 。 但 是 除非 在 调用 了 pthread_barrier_destroy 函 数 之 后 ， 又 调用 了 
barrier_init 函 数 对 计数 用 另外 的 数 进行 初始 化 ， 否 则 屏障 计数 不 

p Z 

实例 

re 图 11-16 给 出 了 在 一 个 任务 上 合作 的 多 个 线程 之 间 如 何 用 屏障 进行 
AIP o 











#include "apue ,hn 
tinclude <pthread.h> 
#include <limits.h> 
finclude <sys/time.h> 


tdefine NTHR 8 /* number of threads */ 
define NUMNUM 8000000L /* number of numbers to sort */ 
#define TNUM (NUMNUM/NTHR)  /* number to sort per thread */ 


long nums [NUMNUM] ; 
long snums [NUMNUM] ; 


pthread barrier_t b; 


ifdef SOLARIS 
define heapsort qsort 
telse 
extern int heapsort (void *, size_t, size_t, 
int (*) (const void *, const void *)); 
fendif 


/+* 


* Compare two long integers (helper function for heapsort) 


f Big s 
complong (const void *argl, const void *arg2) 


{ 


= 
O 
5 

Q 
= 
H 
| 


<CLlong *) anga.-> 
long 12 = *(long *)arg2; 


if (11 == 12) 
return Oz 
ise 3E (CEL = 22) 
return. EE 

else 
return, Ls 


/* 
* Worker thread to sort a portion of the set of numbers. 
baa’ 4 
void * 
thr tnivoid *arg) 
{ 
long idx = (long)arg; 


heapsort (&nums [idx], TNUM, sizeof(long), complong) ; 
pthread_barrier wait (&b); 


/* 
x Go off and perform more work ... 
ay 


return((void *)0); 


/* 
* Merge the results of the individual sorted ranges. 


fe 


void 

merge () 

{ 
long idx [NTHR]; 
long iy, Da. siax, nim, 
for (i = O; a2 < NTER; i++) 


idx[i] = i * TNUM; 

for (sidx = O; sidx < NUMNUM; sidx++) { 
num = LONG MAX; 
for (i = OF a < NTHR; itt) f 


LF CCiadx[il < €i+1)*2NUM) e tnums[id=[il] < num) } 
num = nums[idx[i]]; 
minidx = i; 
} 
} 
snums[sidx] = nums[idx[minidx]]; 


idx [minidx]++; 


int 


main () 
{ 
unsigned long ay? 
struct timeval start, end; 
long long startusec, endusec; 
double elapsed; 
int err; 
pthread_t pelt lt 
/* 
* Create the initial set of numbers to sort. 
sf 


srandom(1) ; 
for (i = 0; i < NUMNUM; i++) 


nums[i] = random(); 
/* 
* Create 8 threads to sort the numbers. 
多 


gettimeofday(&start, NULL); 
pthread_barrier_init(&b, NULL, NTHRt+1); 
for (i = 0; i < NTHR; i++) { 
err = pthread_create(&tid, NULL, thr_fn, (void *) (i * TNUM)); 
if (err != 0) 
err exit (err, "can't create thread"); 
} 
pthread barrier wait (&b) ; 
merge (); 
gettimeofday(&end, NULL); 


/* 
* Print the sorted list. 
#7 
startusec = start.tv_sec * 1000000 + start.tv_usec; 
endusec = end.tv_sec * 1000000 + end.tv_usec; 
elapsed = (double) (endusec - startusec) / 1000000.0; 
printf ("sort took %.4£ seconds\n", elapsed); 
for (i = 0; i < NUMNUM; i++) 

printf("$ld\n", snums[i]); 
exit (0); 


图 11-16 使 用 屏障 

这 个 例子 给 出 了 多 个 线程 只 执行 一 个 任务 时 ， 使 用 屏障 的 简单 情 
况 。 在 更 加 实际 的 情况 下 ， 工 作 线程 在 调用 pthread_barrier_wait 函 数 返 
回 后 会 接着 执行 其 他 的 活动 。 

在 这 个 实例 中 ， 使 用 8 个 线程 分 解 了 800 万 个 数 的 排序 工作 。 每 个 线 
程 用 堆 排 序 算法 对 100 万 个 数 进 行 排 序 〈 详 细 算 法 请 参阅 
Knuth[1998]) 。 然 后 主线 程 调 用 一 个 函数 对 这 些 结果 进行 合并 。 

并 不 需要 使 用 pthread_barrier_wait 函数 中 的 返回 值 
PTHREAD_BARRIER_SERIAL_ THREAD 来 决定 哪个 线程 执行 结果 合 
并 操作 ， 因 为 我 们 使 用 了 主线 程 来 完成 这 个 任务 。 这 也 是 把 屏障 计数 值 
设 为 工作 线程 数 加 1 的 原因 ， 主 线程 也 作为 其 中 的 一 个 候选 线程 。 

如 果 只 用 一 个 线程 去 完成 800 万 个 数 的 堆 排 序 ， 那 么 与 图 11-16 中 的 
程序 相 比 ， 我 们 将 能 看 到 图 11-16 中 的 程序 在 性 能 上 有 显著 提升 。 在 8 核 
处 理 器 系统 上 ， 单 线程 程序 对 800 万 个 数 进行 排序 需要 12.14 秒 。 同 样 的 
系统 ， 使 用 8 个 并 行 线 程 和 1 个 合并 结果 的 线程 ， 相 同 的 800 万 个 数 的 排 
序 仅 需要 1.91 秒 ， 速 度 提 升 了 6 倍 。 














11.7 小 结 


本 章 介绍 了 线程 的 概念 ， 讨 论 了 现 有 的 创建 和 销毁 线程 的 POSIX.1 
原 语 ， 此 外 ， 还 介绍 了 线程 同步 问题 ， 讨 论 了 5 个 基本 的 同步 机 制 〈 互 
斥 量 、 读 写 锁 、 条 件 变 量 、 目 旋 锁 以 及 屏障 ) ， 了 解 了 如 何 使 用 它们 来 
保护 共享 资源 。 








习题 


a 11.1 ”修改 图 11-4 所 示 的 实例 代码 ， 正 确 地 在 两 个 线程 之 则 传递 结 
Ap 
11.2 ”在 图 11-14 所 示 的 实例 代码 中 ， 需 要 男 外 添加 什么 同步 (如 果 
需要 的 话 ) 可 以 使 得 主线 程 改变 与 挂 起 作业 关联 的 线程 ID? 这 会 对 
job_remove 函 数 产 生 什 么 影响 ? 
11.3 ”把 图 11-15 中 的 技术 运用 到 工作 线程 实例 (图 11-1 和 图 11-14) 
中 实现 工作 线程 函数 。 不 要 和 态 记 更 新 queue_init 函数 对 条 件 变 量 进行 初 
始 化 ， 修 改 job_insert 和 job_append 函 数 给 工作 线程 发 信号 。 会 出 现 什么 
样 的 困难 ? 
11.4 下 面 哪个 步骤 序列 是 正确 的 ? 
(1) 对 互 斥 量 加 锁 (pthread_mutex_lock) 。 
(2) 改变 互 斥 量 保护 的 条 件 。 
(3) 给 等 待 条件 的 线程 发 信号 (pthread_cond_broadcast) 。 
(4) 对 互 斥 量 解锁 〈pthread_mutex_unlock) 。 
或 者 
(1) 对 互 斥 量 加 锁 〈pthread_mutex_lock) 。 
(2) 改变 互 斥 量 保护 的 条 件 。 
(3) 对 互 斥 量 解锁 (pthread_mutex_unlock) 。 
(4) 给 等 竺 条 件 的 线程 发 信号 〈pthread_cond_broadcast) 。 
11.5 “实现 屏障 需要 什么 同步 原 语 ? 给 出 pthread_barrier wait 函数 的 
一 个 实现 。 





12.1 5/8 


第 11 章 讲 了 线程 以 及 线程 同步 的 基础 知识 。 本 章 将 讲解 控制 线程 
行为 方面 的 详细 内 容 ， 介 绍 线程 属性 和 同步 原 语 属性 。 前 面 的 章节 中 使 
用 的 都 它们 的 默认 行为 ， 没 有 进行 详细 介绍 。 

接 下 来 还 将 介绍 同一 进程 中 的 多 个 线程 之 间 如 何 保持 数据 的 私有 
性 。 最 后 讨论 基于 进程 的 系统 调用 如 何 与 线程 进行 交互 。 





12.2 线程 限 荐 


在 2.5.4 节 中 讨论 了 sysconf 函 数 。Single UNIX Specification 定 义 了 与 
线程 操作 有 关 的 一 些 限 制 ， 图 2-11 并 没有 列 出 这 些 限 制 。 与 其 他 的 系统 
限制 一 样 ， 这 些 限 制 也 可 以 通过 sysconf 函 数 进 行 查询 。 图 12-1 总 结 了 这 
些 限 制 。 


THREAD DESTRUCTOR | 线程 退出 时 操作 系统 实现 试图 销毁 线程 特 | SC THREAD DESTRUCTOR. 


p 
ITERATIONS 定数 据 的 最 大 次 数 ( 见 12.6 4) ITERATIONS 
PTHREAD KEYS MAX 进程 可 以 创建 的 键 的 最 大 数 日 ( 见 126 节 ) | SC THREAD KEYS MAX 
PTHREAD STACK MIN 个 线程 的 本 可 用 的 最 小 字 书 数 ( 见 123 节 ) | SC THREAD STACK MIN 
PTHREAD THREADS MAX | 进程 可 以 创建 的 最 大 线程 煞 ( 见 123 节 ) | SC THREAD THREADS MAX 
图 12-1 线程 限制 和 sysconf 的 name 参 数 

与 sysconf 报告 的 其 他 限制 一 样 ， 这 些 限 制 的 使 用 是 为 了 增强 应 用 
程序 在 不 同 的 操作 系统 实现 之 间 的 可 移植 性 。 人 例如， 如果 应 用 程序 需要 
为 它 管 理 的 每 个 文件 创建 4 个 线程 ， 但 是 系统 却 并 不 允许 创建 所 有 这 些 
线程 ， 这 时 可 能 就 必须 限制 当前 可 并 发 管理 的 文件 数 。 

图 12-2 给 出 了 本 书 描 述 的 4 种 操作 系统 实现 中 线程 限制 的 值 。 如 果 
操作 系统 实现 的 限制 是 不 确定 的 ， 列 出 的 值 就 是 “没有 确定 的 限制 ”(no 
limit) 。 但 这 并 不 意味 着 值 是 无 限制 的 。 


FreeBSD 8.0 Linux 3.2.0 | MacOSX1068 | Solaris 10 


PTHREAD DESTRUCTOR ITERATIONS 没有 确定 的 限制 


























PTHREAD KEYS MAX 1024 没有 确定 的 限制 
PTHREAD STACK MIN 2 048 16384 8192 § 192 
PTHREAD THREADS MAX 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 











图 12-2 线程 配置 限制 的 实例 
注意 ， 虽 然 某 个 操作 系统 实现 可 能 没有 提供 访问 这 些 限 制 的 方法 ， 
但 这 并 不 意味 着 这 些 限 制 不 存在 ， 这 只 是 意味 着 操作 系统 实现 没有 为 使 
用 sysconf 访 问 这 些 值 提供 可 用 的 方法 。 





12.3 线程 属性 


pthread ”接口 允许 我 们 通过 设置 每 个 对 象 天 联 的 不 同属 性 来 细 调 线 
程 和 同步 对 象 的 行为 。 通 常 ， 管 理 这 些 属性 的 函数 都 遵循 相同 的 模式 。 
(1) 每 个 对 象 与 它 自 己 类 型 的 属性 对 象 进行 关联 《线程 与 线程 属 
性 关联 ， 互 斥 量 与 互 斥 量 属性 关联 ， 等 等 ) 。 一 个 属性 对 象 可 以 代表 多 
个 属性 。 属 性 对 象 对 应 用 程序 来 说 是 不 透明 的 。 这 意味 痢 应 用 程序 并 不 
需要 了 解 有 关 属 性 对 象 内 部 结构 的 详细 细节 ， 这 样 可 以 增强 应 用 程序 的 
可 移植 性 。 取 而 代 之 的 是 ， 需 要 提供 相应 的 函数 来 管理 这 些 属 性 对 象 。 
(2) 有 一 个 初始 化 函数 ， 把 属性 设置 为 默认 值 。 
(3) 还 有 一 个 销毁 属性 对 象 的 函数 。 如 有 条 初始 化 函数 分 配 了 与 属 
性 对 象 关联 的 资源 ， 销 毁 函 数 负 责 释 放 这 些 资源 。 
(4) 每 个 属性 都 有 一 个 从 属性 对 象 中 获取 属性 值 的 函数 。 由 于 函 
数 成 功 时 会 返回 0， 失 败 时 会 返回 错误 编号 ， 所 以 可 以 通过 把 属性 值 存 
储 在 函数 的 某 一 个 参数 指定 的 内 存单 元 中 ， 把 属性 值 返 回 给 调用 者 。 
(5) 每 个 属性 都 有 一 个 设置 属性 值 的 函数 。 在 这 种 情况 下 ， 属 性 
值 作 为 参数 按 值 传递 。 
在 第 11 章 所 有 调用 pthread_create 函 数 的 实例 中 ， 传 入 的 参数 都 是 空 
站 针 ， 而 不 是 指 问 pthread_attr_t 结 构 的 指针 。 可 以 使 用 pthread_attr_t 结 
构 修 改线 程 默认 属性 ， 并 把 这 些 属性 与 创建 的 线程 联系 起 来 。 可 以 使 用 
pthread_attr_init 函 数 初 始 化 pthread_attr_ t 结 构 。 在 调用 pthread_attr_init 以 
后 ，pthread_attr_t 结 构 所 包含 的 就 是 操作 系统 实现 文 持 的 所 有 线程 属性 
的 默认 值 。 
#include <pthread.h> 
int pthread_attr_init(pthread_attr_t *attr); 
int pthread_attr_destroy(pthread_attr_t *attr); 
两 个 函数 的 返回 值 : Ak, Eo; 否则 ， 返 回 错误 编号 
如 果 要 反 初 始 化 pthread_attr_t 结 构 ， 可 以 调用 pthread_attr_destroy 孜 
数 。 如 果 pthread_attr_init 的 实现 对 属性 对 象 的 内 存 空间 是 动态 分 配 的 ， 
pthread_attr_destroy 就 会 释放 该 内 存 空 间 。 除 此 之 外 ， 
pthread_attr_destroy 还 会 用 无 效 的 值 初始 化 属性 对 象 ， 因 此 ， 如 果 该 属 
性 对 象 被 误 用 ， 将 会 导致 pthread_create 函 数 返回 错误 码 。 
图 12-3 总 结 了 POSIX.1 定义 的 线程 属性 。POSIX.1 还 为 线程 执行 
调度 (Thread Execution Scheduling) 选项 定义 了 额外 的 属性 ， 用 以 文 持 






































实时 应 用 ， 但 我 们 并 不 打算 在 这 里 讨论 这 些 属 性 。 图 12-3 同 时 给 出 了 各 
个 操作 系统 平台 对 每 个 线程 属性 的 文 持 情 况 。 
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图 12-3 POSIX.1 线 程 属性 

11.5 节 介绍 了 分 离线 程 的 概念 。 如 有 果 对 现 有 的 某 个 线程 的 终止 状态 
不 感 兴趣 的 话 ， 可 以 使 用 pthread_detach 函 数 让 操作 系统 在 线程 退出 时 收 
回 它 所 占用 的 资源 。 

如 果 在 创建 线程 时 就 知道 不 需要 了 解 线 程 的 终止 状态 ， 就 可 以 修改 
pthread_attr t ”结构 中 的 detachstate 线 程 属性 ， 让 线程 一 开始 就 处 于 分 离 
状态 。 可 以 使 用 pthread_attr_setdetachstate 函 数 把 线程 属性 detachstate 设 
置 成 以 下 两 个 合法 值 之 一 : PTHREAD_CREATE_DETACHED， 以 分 离 
状态 启动 线程 ， 或 者 PTHREAD_CREATE _JOINABLE， 正 常 启动 线 
程 ， 应 用 程序 可 以 获取 线程 的 终止 状态 。 

#include <pthread.h> 

int pthread_attr_getdetachstate(const pthread_attr_t *restrict attr, 

int *detachstate); 
int pthread_attr a a attr_t *attr, int *detachstate); 
两 个 函数 的 返回 值 : ARI, JRO; AM, ER 

可 以 调用 pthread_attr _getdetachstate 函数 获取 当前 的 detachstate 线 程 
属性 。 第 二 个 参数 所 指 癌 的 整数 要 ABLE I 
PTHREAD CREATE DETACHED, ZAK EM 
PTHREAD_ CREATE _JOINABLE, 具体 要 取 次 于 给 定 pthread_attr {结构 

中 的 属性 值 。 
实例 
图 12-4 给 出 了 一 个 以 分 离 状 态 创建 线程 的 函数 。 




















finclude "apue ,hn 
tinclude <pthread, h> 


int 
makethread (void *(*fn) (void *), vold *arg) 
| 

int err; 

pthread t tid; 

pthread attr t attr; 


err = pthread attr init (éattr); 
if (err != 0) 

return (err) ; 
err = pthread_attr_setdetachstate(‘attr, PTHREAD CREATE DETACHED) ; 
if (err == 0) 

err = pthread_create(étid, sattr, fn, arg); 
pthread_attr_destroy(éattr) ; 
return (err); 





图 12-4 以 分 离 状态 创建 线程 
注意 ， 此 例 忽略 了 pthread_attr_destroy 函 数 调用 的 返回 值 。 在 这 个 
实例 中 ， 我 们 对 线程 属性 进行 了 合理 的 初始 化 ， 因 此 
pthread_attr_destroy 应 该 不 会 失败 。 但 是 ， 如 果 pthread_attr_destroy 确 实 
出 现 了 失败 的 情况 ， 将 难以 清理 : 必须 销毁 刚刚 创建 的 线程 ， 也 许 这 个 
线程 可 能 已 经 运行 ， 并 且 与 “pthread_attr_destroy ”函数 可 能 是 异步 执行 
的 。 忽 略 pthread_attr_destroy 的 错误 返回 可 能 出 现 的 最 坏 情况 是 ， 如 果 
pthread_attr_init CASAC SAR, SAAD BINA Fil. FO 
面 ， 如 果 pthread_attr_init 成功 地 对 线程 属性 进行 了 初始 化 ， 但 之 后 
pthread_attr_destroy 的 清理 工作 失败 ， 那 么 将 没有 任何 补救 策略 ， 因 为 
线程 属性 结构 对 应 用 程序 来 说 是 不 透明 的 ， 可 以 对 线程 属性 结构 进行 清 








理 的 唯一 接口 是 pthread_attr_destroy， 但 它 失败 了 。 

对 于 遵循 POSIX 标 准 的 操作 系统 来 说 ， 并 不 一 定 要 文 持 线程 栈 属 
性 ， 但 是 对 于 遵循 Single UNIX Specification 中 XSI 选项 的 系统 来 说 ， 支 
持 线程 栈 属性 就 是 必需 的 。 可 以 在 编译 阶段 使 用 
_POSIX_THREAD_ATTR_STACKADDR 和 
_POSIX_THREAD_ATTR_STACKSIZE 符 号 来 检查 系统 是 否 支持 每 一 个 
线程 栈 属性 。 如 果 系 统 定义 了 这 些 符 写 中 的 一 个 ， 就 说 明 它 支持 相应 的 
线程 栈 属性 。 或 者 ， 也 可 以 在 运行 阶段 把 _SC_THREAD_ATTR_ 
STACKADDR 和 _SC_THREAD_ATTR_STACKSIZE 参数 传 给 sysconf 函 
数 ， 检 查 运行 时 系统 对 线程 栈 属性 的 支持 情况 。 

可 以 使 用 函数 pthread_attr_getstack 和 pthread_attr_setstack 对 线程 栈 属 
性 进行 管理 。 

#include <pthread.h> 

int pthread_attr_getstack(const pthread_attr_t *restrict attr, 

void **restrict stackaddr, 
size_t *restrict stacksize); 
int pthread_attr_setstack(pthread_attr_t *attr, 
void *stackaddr, size_t stacksize); 
两 个 函数 的 返回 值 : ARI, JRO; 否则， 返回 错误 编号 

对 于 进程 来 说 ， 虚 地 址 空间 的 大 小 是 固定 的 。 因 为 进程 中 只 有 一 个 
栈 ， 所 以 它 的 大 小 通常 不 是 问题 。 但 对 于 线程 来 说 ， 同 样 大 小 的 虚 地 址 
空间 必须 被 所 有 的 线程 栈 共有 部。 如 采 应 用 程序 使 用 了 许多 线程 ， 以 致 这 
些 线程 栈 的 累计 大 小 超过 了 可 用 的 虚 地 址 空间 ， 就 需要 减少 默认 的 线程 
栈 大 小 。 男 一 方面 ， 如 果 线 程 调 用 的 函数 分 配 了 大 量 的 自动 变量 ， 或 者 
调用 的 函数 涉及 许多 很 深 的 栈 帧 (stack frame) ， 那 么 需要 的 栈 大 小 可 
能 要 比 默认 的 大 。 

如 果 线 程 栈 的 虚 地 址 空间 都 用 完了 ， 那 可 以 使 用 malloc 或 者 
mmap 〈 见 14.8 节 ) 来 为 可 蔡 代 的 栈 分 配 空间 ， 并 用 pthread_attr_setstack 
函数 来 改变 新 建 线 程 的 栈 位 置 。 由 stackaddr 参 数 指 定 的 地 址 可 以 用 作 线 
程 栈 的 内 存 范 围 中 的 最 低 可 寻 址 地 址 ， 该 地 址 与 处 理 器 结构 相应 的 边界 
应 对 齐 。 当 然 ， 这 要 假设 malloc 和 mmap 所 用 的 虚 地 址 范围 与 线程 栈 当 
前 使 用 的 虚 地 址 范围 不 同 。 

stackaddr 线 程 属性 被 定义 为 栈 的 最 低 内 存 地 址 ， 但 这 并 不 一 定 是 栈 
的 开始 位 置 。 对 于 一 个 给 定 的 处 理 器 结构 来 说 ， 如 果 栈 是 从 高 地 址 同 低 
ae 同 增 长 的 ， 那 么 stackaddr 线 程 属性 将 是 栈 的 结尾 位 置 ， 而 不 是 开 

HW. E. o 
应 用 程序 也 可 以 通过 pthread_attr_getstacksize 和 











pthread_attr_setstacksize 函 数 读 取 或 设置 线程 属性 stacksize。 

#include <pthread.h> 

int pthread_attr_getstacksize(const pthread_attr_t *restrict attr, 

size_t *restrict stacksize); 
int pthread_attr_setstacksize (pthread_attr_t *attr, size_t stacksize); 
PAT PRCA IE: 大 成 功 ， 返 回 0; 否则， 返回 错误 编号 

如 末 和 希望 改变 黑 认 的 栈 大 小 ， 但 义 不 想 目 己 处 理 线程 栈 的 分 配 问 
题 ， 这 时 使 用 pthread_attr_setstacksize 函 数 就 非常 有 用 。 设 置 stacksize 属 
性 时 ， 选 择 的 stacksize 不 能 小 于 PTHREAD_STACK_MIN。 

线程 属性 guardsize 控 制 痢 线程 栈 末尾 之 后 用 以 避免 栈 溢出 的 扩展 内 
存 的 大 小 。 这 个 属性 默认 值 是 由 具体 实现 来 定义 的 ， 但 常用 值 是 系统 页 
大 小 。 可 以 把 guardsize 线 程 属性 设置 为 0， 不 允许 属性 的 这 种 特征 行为 
RE: 在 这 种 情况 下 ， 不 会 提供 警戒 缓冲 区 。 同 样 ， 如 果 修 改 了 线程 属 
性 stackaddr， 系 统 惑 认为 我 们 将 自己 管理 栈 ， 进 而 使 栈 警 戒 缓 冲 区 机 制 
无 效 ， 这 等 同 于 把 guardsize 线 程 属 性 设置 为 0。 

#include <pthread.h> 

iint pthread_attr_getguardsize(const pthread_attr_t *restrict attr, 

size_t *restrict guardsize); 
int pthread_attr_setguardsize(pthread_attr_t *attr, size_t guardsize); 
PAT PRAIRIE: ARH, eE; 否则， 返回 错误 编号 

如 果 guardsize 线 程 属性 被 修改 了 ， 操 作 系 统 可 能 会 把 它 取 为 页 大 小 
的 整数 倍 。 如 果 线 程 的 栈 指针 洲 出 到 警戒 区 域 ， 应 用 程序 就 可 能 通过 信 
号 接收 到 出 错 信息 。 

Single UNIX Specification 还 定义 了 一 些 其 他 的 可 选 线程 属性 供 实时 
应 用 程序 使 用 ， eee eee 

线程 还 有 一 些 其 他 的 pthread_attr_t 结 构 中 没有 表示 的 属性 : 可 撤销 
状态 和 可 撤销 类 型 。 我 们 将 在 12.7 市 中 讨论 它们 。 














12.4 同步 属性 


束 像 线程 具有 属性 一 样 ， 线 程 的 同步 对 象 也 有 属性 。11.6.7 市 中 介 
绍 了 目 旋 锁 ， 它 有 一 个 属性 称 为 进程 共享 属性 。 本 节 讨 论 互 斥 量 属性 、 
读 写 锁 属性 、 条 件 变 量 属性 和 屏障 属性 。 


12.4.1 F FEJET 


互 斥 量 属性 是 用 pthread_mnutexattr_t 结 构 表 示 的 。 第 11 章 中 每 次 对 互 
斥 量 进行 初始 化 时 ， 都 是 通过 使 用 PTHREAD_MUTEX_INITIALIZER 党 
量 或 者 用 指 同 互 斥 量 属性 结构 的 空 指针 作为 参数 调用 pthread_mutex_init 
国 数 ， 得 到 互 斥 量 的 默认 属性 。 

对 于 非 默认 属性 ， 可 以 用 pthread_mutexattr_init 初 始 化 
pthread_mnutexattr_ t 结 构 ， 用 pthread_mutexattr_destroy 来 反 初 始 化 。 

#include <pthread.h> 

int pthread_mutexattr_init(pthread_mutexattr_t *attr); 

int pthread_mutexattr_destroy(pthread_mutexattr_t *attr); 

两 个 函数 的 返回 值 : ARJ, eo; 否则 ， 返 回 错误 编号 

pthread_mutexattr_init PR SCE FA BRA AY EJF ER PE a 
pthread_mutexattr_t 结 构 。 值 得 注意 的 3 个 属性 是 : 进程 共享 属性 、 健 壮 
属性 以 及 类 型 属性 。POSIX.1 中 ， 进 程 共享 属性 是 可 选 的 。 可 以 通过 检 
查 系统 中 是 否定 义 了 _POSIX_THREAD_PROCESS_SHARED 符号 来 判 
汤 这 个 平台 是 否 支 持 进程 共享 这 个 属性 ， 也 可 以 在 运行 时 把 
_SC_THREAD_PROCESS_SHARED 参数 传 给 sysconf 函 数 进 行 检 查 。 虽 
然 这 个 选项 并 不 是 遵循 POSIX 标 准 的 操作 系统 必须 提供 的 ， 但 是 Single 
UNIX Specification 要 求 遵循 XSI 标 准 的 操作 系统 文 持 这 个 选项 。 

在 进程 中 ， 多 个 线程 可 以 访问 同一 个 同步 对 象 。 正 如 在 第 11 章 中 看 
到 的 ， 这 是 默认 的 行为 。 在 这 种 情况 下 ， 进 程 共享 互 斥 量 属性 需 设 置 为 
PTHREAD_PROCESS_PRIVATE. 

我 们 将 在 第 14 章 和 第 15 章 中 看 到 ， 存 在 这 样 的 机 制 : 允许 相互 独立 
的 多 个 进程 把 同一 个 内 存 数据 块 映 射 到 它们 各 上 自 独立 的 地 址 空间 中 。 就 
像 多 个 线程 访问 共享 数据 一 样 ， 多 个 进程 访问 共享 数据 通常 也 需要 同 
步 。 如 果 进 程 共享 互 斥 量 属 性 设置 为 PTHREAD_PROCESS_SHARED， 
从 多 个 进程 彼此 之 间 共 享 的 内 存 数据 块 中 分 配 的 互 斥 量 就 可 以 用 于 这 些 
































进程 的 同步 。 

可 以 使 用 pthread_mutexattr_getpshared 函 数 查 询 pthread_mnutexattr_ { 
结构 ， 得 到 它 的 进程 共享 属性 ， 使 用 pthread_mutexattr_setpshared 函 数 修 
改进 程 共享 属性 。 

#include <pthread.h> 

int pthread_mutexattr_getpshared(const pthread_mutexattr_t 

*restrict attr, 
int *restrict pshared); 
int pthread_mutexattr_setpshared(pthread_mutexattr_t *attr, 
int pshared); 
两 个 函数 的 返回 值 : ARI, JRO; 否则 ， 返 回 错误 编号 

进程 共享 互 斥 量 属性 设置 为 PTHREAD_PROCESS_PRIVATE 时 ， 人 多 
许 pthread 线 程 库 提 供 更 有 效 的 互 斥 量 实现 ， 这 在 多 线程 应 用 程序 中 是 默 
认 的 情况 。 在 多 个 进程 共享 多 个 互 斥 量 的 情况 下 ， ”pthread 线 程 库 可 以 
限制 开销 较 大 的 互 斥 量 实现 。 

互 斥 量 健壮 属性 与 在 多 个 进程 间 共 享 的 互 斥 量 有 关 。 这 意味 着 ， 当 
持 有 互 斥 量 的 进程 终止 时 ， 需 要 解决 互 斥 量 状 态 恢 复 的 问题 。 这 种 情况 
发 生 时 ， 互 斥 量 处 于 锁定 状态 ， 恢 复 起 来 很 困难 。 其 他 阻 豆 在 这 个 锁 的 
BREA BAZ FS. 

可 以 使 用 pthread_mutexattr_getrobust 函数 获取 健壮 的 互 斥 量 属性 的 
值 。 可 以 调用 pthread_mnutexattr_setrobust 函 数 设置 健壮 的 互 斥 量 属性 的 
值 。 

#include <pthread.h> 

int pthread_mutexattr_getrobust(const pthread_mutexattr_t 

*restrict attr, 
int *restrict robust); 
int pthread_mutexattr_setrobust(pthread_mutexattr_t *attr, 
int robust); 
两 个 函数 的 返回 值 : ARI, JRO; 否则， 返回 错误 编号 

健壮 属性 取 值 有 两 种 可 能 的 情况 。 默 认 值 是 
PTHREAD_MUTEX_STALLED， 这 意味 着 持 有 互 斥 量 的 进程 终止 时 不 
需要 采取 特别 的 动作 。 这 种 情况 下 ， 使 用 互 斥 量 后 的 行为 是 未 定义 的 ， 
等 待 该 互 斥 量 解锁 的 应 用 程序 会 被 有 效 地 “ 拖 住 ?>。 另 一 个 取 值 是 
PTHREAD_MUTEX_ROBUST。 这 个 值 将 导致 线程 调用 
pthread_mnutex_lock 获 取 锁 ， 而 该 锁 被 另 一 个 进程 持 有 ， 但 它 终止 时 并 
没有 对 该 锁 进 行 解锁 ， 此 时 线程 会 阻 圳 ， 从 pthread_mnutex_lock 返 回 的 
值 为 EOWNERDEAD 而 不 是 0。 应 用 程序 可 以 通过 这 个 特殊 的 返回 值 获 



































知 ， 奉 有 可 能 (要 保护 状态 的 细节 以 及 如 何 进 行 恢复 会 因 不 同 的 应 用 程 
序 而 异 ) ， 不 管 它 们 保护 的 互 斥 量 状态 如 何 ， 都 需要 进行 恢复 。 

使 用 健壮 的 互 斥 量 改变 了 我 们 使 用 pthread_mutex_lock 的 方式 ， 
为 现在 必须 检查 3 个 返回 值 而 不 是 之 前 的 两 个 : 不 需要 恢复 的 成 功 、 需 
要 恢复 的 成 功 以 及 失败 。 但 是 ， 即 使 不 用 健壮 的 互 斥 量 ， 也 可 以 只 检查 
成 功 或 者 失败 。 

在 本 书 的 4 个 平台 中 ， 只 有 Linux 3.2.0 目 前 支持 健壮 的 线程 互 斥 量 。 
Solaris 10 只 在 它 的 Solaris 线 程 库 中 支持 健壮 的 线程 互 斥 量 〈 参 哆 Solaris 
手册 的 mutex_init(3C) 获 取 相 关 的 信息 ) 。 但 是 Solaris 11 文 持 健壮 的 线程 
ERE. 

如 果 应 用 状态 无 法 恢复 ， 在 线程 对 互 斥 量 解锁 以 后 ， 该 互 斥 量 将 处 
于 永久 不 可 用 状态 。 为 了 避免 这 样 的 问题 ， 线 程 可 以 调用 
pthread_mutex_consistent 函数 ， 指 明 与 该 互 斥 量 相关 的 状态 在 互 斥 量 解 
锁 之 前 是 一 致 的 。 

#include <pthread.h> 

int pthread_mutex_consistent(pthread_mutex_t *mutex); 

返回 值 : BR, dello; 否则 ， 返 回 错误 编号 

如 果 线 程 没 有 先 调用 pthread_mutex_consistent 就 对 互 斥 量 进行 了 解 
锁 ， 那 么 其 他 试图 获取 该 互 斥 量 的 阻 考 线程 束 会 得 到 错误 码 
ENOTRECOVERABLE。 如 果 发 生 这 种 情况 ， 互 斥 量 将 不 再 可 用 。 线 程 
通过 提前 调用 pthread_mutex_consistent， 能 让 互 斥 量 正 弟 工作 ， 这 样 它 
束 可 以 持续 被 使 用 。 

l 类 型 互 斥 量 属性 控制 着 互 斥 量 的 锁定 特性 。POSIX.1 定 义 了 4 种 类 
型 。 

PTHREAD_MUTEX_NORMAL 一 种 标准 互 斥 量 类 型 ， 不 做 任何 特 
殊 的 错误 检查 或 死 锁 检测 。 

PTHREAD_MUTEX_ERRORCHECK 此 互 斥 量 类 型 提供 错误 检查 。 

PTHREAD_MUTEX_RECURSIVE 此 互 斥 量 类 型 允许 同一 线程 在 互 
斥 量 解锁 之 前 对 该 互 斥 量 进行 多 次 加 锁 。 递 归 互 斥 量 维护 锁 的 计数 ， 在 
解锁 次 数 和 加 锁 次 数 不 相 同 的 情况 下 ， 不 会 释放 锁 。 所 以 ， 如 果 对 一 个 
递归 互 斥 量 加 锁 两 次 ， 然 后 解锁 一 次 ， 那 么 这 个 互 斥 量 将 依然 处 于 加 锁 
状态 ， 对 它 再 次 解锁 以 前 不 能 释放 该 锁 。 

PTHREAD_MUTEX_DEFAULT 此 互 斥 量 类 型 可 以 提供 默认 特性 和 
行为 。 操 作 系 统 在 实现 它 的 时 候 可 以 把 这 种 类 型 自由 地 映射 到 其 他 互 斥 
量 类 型 中 的 一 种 。 例 如 ，Linux 3.2.0 把 这 种 类 型 映射 为 普通 的 互 斥 量 类 
型 ， 而 FreeBSD 8.0 则 把 它 映 射 为 错误 检查 互 斥 量 类 型 。 

这 4 种 类 型 的 行为 如 图 12-5 所 示 。 “不 占用 时 解锁 ”这 一 栏 指 的 是 ， 






































一 个 线程 对 被 妨 一 个 线程 加 锁 的 互 斥 量 进 行 解锁 的 情况 。“ 在 已 解锁 时 
解锁 ”这 一 栏 指 的 是 ， 当 一 个 线程 对 已 经 解锁 的 互 斥 量 进行 解锁 时 将 会 
发 生 什 么 ， 这 通常 是 编码 错误 引起 的 。 





没有 解锁 时 重新 加 锁 ? 


THREAD MUTEX NORMAL 死 锁 REX KEN 
THREAD. MUTEX ERRORCHECK 返回 错误 REK 返回 错误 
UTEX RECURSIVE it IRIEL Re 返回 错误 
UTEX DEFAULT KEN REX KEX 


图 12-5 互 斥 量 类 型 行为 

可 以 用 pthread_mutexattr_gettype 函 数 得 到 互 斥 量 类 型 属性 ， 用 
pthread_mnutexattr_settype 函 数 修改 互 斥 量 类 型 属性 。 

#include <pthread.h> 

int pthread_mutexattr_gettype(const = pthread_mutexattr_t*restrict 
attr,int*restrict type); 

int pthread_mutexattr_settype(pthread_mutexattr_t *attr, int type); 

两 个 函数 的 返回 值 : 奋 成 功 ， 返 回 0; 否则， 返回 错误 编号 

回忆 11.6.6 贡 中 学 过 的 ， 互 斥 量 用 于 保护 与 条 件 变量 关联 的 条 件 。 
在 阻塞 线程 之 前 ，pthread_cond_wait 和 pthread_cond_timedwait 函 数 释 放 
与 条 件 相 关 的 互 斥 量 。 这 就 允许 其 他 线程 获取 互 斥 量 、 改 变 条 件 、 释 放 
互 斥 量 以 及 给 条 件 变 量 及 信和 号。 既然 改变 条 件 时 必须 占有 互 斥 量 ， 使 用 
递归 互 斥 量 就 不 是 一 个 好 主意 。 如 果 递 归 互 斥 量 被 多 次 加 锁 ， 然 后 用 在 
调用 pthread_cond_wait 函 数 中 ， 那 么 条 件 永 远 都 不 会 得 到 满足 ， 因 为 
pthread_cond_wait 所 做 的 解锁 操作 并 不 能 释放 互 斥 量 。 

如 有 果 需 要 把 现 有 的 单线 程 接口 放 到 多 线程 环境 中 ， 递 归 互 斥 量 是 非 
党 有 用 的 ， 但 由 于 现 有 程序 兼容 性 的 限制 ， 不 能 对 函数 接口 进行 修改 。 
然而 ， 使 用 递归 锁 可 能 很 难处 理 ， 因 此 应 该 只 在 没有 其 他 可 行 方案 的 时 
候 才 使 用 它们 。 

实例 

图 12-6 描 述 了 一 种 情况 ， 在 这 种 情况 中 递归 互 斥 量 看 起 来 像 是 在 解 
决 并 发 问题 。 假 设 func1 和 func2 是 函数 库 中 现 有 的 函数 ， 其 接口 不 能 改 
变 ， 因 为 存在 调用 这 两 个 接口 的 应 用 程序 ， 而 且 应 用 程序 不 能 改动 。 
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pthread_mutex_unlock(x->lock) 
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pthread mutex lock(x->lock) 


pthread_mutex_unlock(x->lock) 
图 12-6 使 用 递归 锁 的 一 种 可 能 情况 
为 了 保持 接口 跟 原来 相同 ， 我 们 把 互 斥 量 鞠 入 到 了 数据 结构 中 ， 把 
这 个 数据 结构 的 地 址 (x〉 作 为 参数 传 入 。 这 种 方案 只 有 在 为 此 数据 结 
构 提 供 分 配 函 数 时 才 可 行 ， 所 以 应 用 程序 并 不 知道 数据 结构 的 大 小 假 
设 我 们 在 其 中 增加 互 斥 量 之 后 必须 扩大 该 数据 结构 的 大 小 ) 。 
如 下 在 最 早 定 义 数据 结构 时 ， 预 留 了 足够 的 可 填充 字段 ， 人 允许 把 茶 





些 填 充 字 段 奉 换 成 互 斥 量 ， 这 种 方法 也 是 可 行 的 。 不 过 遗憾 的 是 ， 大 多 
数 程序 员 并 不 善于 预测 未 来 ， 所 以 这 并 不 是 普 衣 可行 的 实践 。 

如 果 func1 和 func2 函 数 都 必须 操作 这 个 结构 ， 而 且 可 能 会 有 一 个 以 
上 的 线程 同时 访问 该 数据 结构 ， 那 么 funcl 和 func2 必须 在 操作 数据 以 
前 对 互 斥 量 加 锁 。 如 果 funcl 必须 调用 func2， 这 时 如 果 互 斥 量 不 是 递归 
类 型 的 ， 那 么 就 会 出 现 死 锁 。 如 果 能 在 调用 func2 之 前 释放 互 斥 量 ， 在 
func2 返回 后 重新 获取 互 斥 量 ， 那 么 就 可 以 避免 使 用 递归 互 斥 量 ， 但 这 
也 给 其 他 的 线程 提供 了 机 会 ， 其 他 的 线程 可 以 在 funcl 执行 期 间 抓 住 互 
斥 量 的 控制 ， 修 改 这 个 数据 结构 。 这 也 许 是 不 可 接受 的 ， 当 然 具 体 的 情 
况 要 取 雇 于 互 斥 量 试图 提供 什么 样 的 保护 。 

图 12-7 显 示 了 这 种 情况 下 使 用 递归 互 斥 量 的 一 种 蔡 代 方法 。 通 过 提 
供 func2 函 数 的 私有 版 本 ， 称 之 为 func2_locked 函 数 ， 可 以 保持 func1 和 
func2 函 数 接口 不 变 ， 而 且 避 免 使 用 递归 互 斥 量 。 要 调用 func2_locked 
函数 ， 必 须 占 鹏 入 在 数据 绪 构 中 的 互 斥 量 ， 这 个 数据 结构 的 地 址 是 作 
为 参数 传 入 的 。func2_locked 的 函数 体 包 含 func2 的 副本 ，func2 现 在 只 是 
获取 互 斥 量 ， 调 用 func2_locked， 然 后 释放 互 斥 量 。 
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pthread mutex lock(x->lock) 
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pthread mutex lock(x->lock) 
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pthread_mutex unlock(x->lock) 
图 12-7 避免 使 用 递归 锁 的 一 种 可 能 情况 
如 果 并 不 一 定 要 保持 库 函 数 接口 不 变 ， 就 可 以 在 每 个 函数 中 增加 第 
二 个 参数 表明 这 个 结构 是 否 被 调用 者 锁定 。 但 是 ， 如 果 可 以 的 话 ， 保 持 
接口 不 变通 向 是 更 好 的 选择 ， 可 以 避免 实现 过 程 中 人 为 加 入 的 东西 对 原 
有 系统 产生 不 民 影 响 。 
提供 加 锁 和 不 加 锁 版 本 的 函数 ， 这 样 的 策略 在 简单 的 情况 下 通 第 是 
可 行 的 。 在 更 加 复杂 的 情况 下 ， 比 如 ， 库 需要 调用 库 以 外 的 函数 ， 而 且 
ee en rar te 
SEB 

















图 12-8 中 的 程序 解释 了 有 必要 使 用 递归 互 斥 量 的 力 一 种 情况 。 这 
里 ， 有 一 个 “超时 ”(timeout〉 函 数 ， 它 允许 安排 为 一 个 函数 在 未 来 的 菏 
个 时 间 运 行 。 假 设 线程 并 不 是 很 昂贵 的 资源 ， 就 可 以 为 每 个 挂 起 的 超时 
函数 创建 一 个 线程 。 线 程 在 时 间 未 到 时 将 一 直 等 待 ， 时 间 到 了 以 后 再 调 
用 请 求 的 函数 。 





tinclude "apue.h" 
finclude <pthread.h> 
tinclude <time.h> 
#1NC 
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include <sys/time.h> 


extern int makethread(void *(*) (void *), void *); 


struct to info { 


void (*to_ fn) ({void WI /* £unction, */ 
void *to_arg; /* argument */ 
struct timespec to_wait; 7/* time to wait */ 


#define SECTONSEC 1000000000 /* seconds to nanoseconds */ 


#if !defined(CLOCK REALTIME) || defined(BSD) 
#define clock_nanosleep(ID, FL, REQ, REM) nanosleep((REQ), (REM) ) 
#endif 


#ifndef CLOCK REALTIME 
#define CLOCK REALTIME 0 
#define USECTONSEC 1000 /* microseconds to nanoseconds */ 


void 
clock_gettime (int id, struct timespec *tsp) 
{ 


struct timeval tv; 


gettimeofday(&tv, NULL); 

csp->tw_sec > tv -tv sec}; 

tsp->tv_nsec = tv.tv_usec * USECTONSEC; 
} 
#endif 


void * 
timeout_helper(void *arg) 
{ 


SENUCE "EG nro YEI? 


tip = (struct to info *) arg; 

clock_nanosleep (CLOCK_REALTIME, 0, &tip->to_wait, NULL); 
(Ftip->Sto_fn) (tip->to arg); 

free (arg); 

return (0); 


void 
timeout (const struct timespec *when, void (*func) (void *), void *arg) 
{ 

struct timespec now; 

Struct tonto tips 

int err; 


clock_gettime (CLOCK_REALTIME, &now) ; 
if ((when->tv_sec > now.tv_sec) || 


(when->tv_sec == now.tv_sec && when->tv_nsec > now.tv_nsec)) { 
tip = malloc(sizeof(struct to_info)); 
af (tip f= WULID í 


tip->to_fn = func; 


tip->to_arg = arg; 
tip->to_wait.tv_sec = when->tv_sec 一 now.tv_sec; 
if (when->tv_nsec >= now.tv_nsec) { 
tip->to_wait.tv_nsec = when->tv_nsec 一 now.tv_nsec; 
} else { 
tip->to_wait.tv_sec--; 
tip->to_wait.tv_nsec = SECTONSEC - now.tv_nsec + 
when->tv_nsec; 


err = makethread(timeout_helper, (void *)tip); 
if (err == 0) 
return; 
else 
free (tip); 


/* 

* We get here if (a) when <= now, or (b) malloc fails, or 

* (c) we can't make a thread, so we just call the function now. 
af, 

(*func) (arg); 


pthread _mutexattr_t attr; 
pthread _mutex_t mutex; 


void 
retry(void *arg) 
{ 
pthread_mutex_lock (&mutex) ; 


/* perform retry steps ... */ 


pthread_mutex_unlock (&mutex) ; 


int 

main (void) 

{ 
i err, GOnadkeion, ard; 
struct timespec when; 


if ((err = pthread_mutexattr_init(&attr)) != 0) 
err exit (err, "pthread _mutexattr_init failed"); 
if ((err = pthread_mutexattr_settype(&attr, 


PTHREAD MUTEX RECURSIVE)) != 0) 
err_exit(err, "can't set recursive type"); 
if ((err = pthread_mutex_init (&mutex, &attr)) != 0) 


err exit(err, “can't create recursive mutex"); 


/* continue processing ... */ 


pthread _mutex_lock (&mutex) ; 


* Check the condition under the protection of a lock to 
* make the check and the call to timeout atomic. 
i: 
if (condition) { 
/+ 
* Calculate the absolute time when we want to retry, 
| 
clock gettime (CLOCK REALTIME, &when) ; 
when.tv sec t= 10;  /* 10 seconds from now */ 
timeout (&when, retry, (void *) ((unsigned long) arg)); 


| 


pthread mutex unlock (&mutex) ; 
/* continue processing ... */ 


exit (0); 


图 12-8 使 用 递归 互 斥 量 

如 果 我 们 不 能 创建 线程 ， 或 者 安排 函数 运行 的 时 间 已 过 ， 这 时 问题 
就 出 现 了 。 在 这 些 情况 下 ， 我 们 只 需 在 当前 上 下 文中 调用 之 前 请 求 运 行 
的 函数 。 因 为 函数 要 获取 的 锁 和 我 们 现在 占有 的 锁 是 同一 个 ， 所 以 除非 
该 锁 是 递归 的 ， 否 则 就 会 出 现 死 锁 。 

在 图 12-4 中 我 们 使 用 makethread 函 数 以 分 离 状态 创建 线程 。 因 为 传 
递 给 timeout 函 数 的 func 函 数 参 数 将 在 未 来 运行 ， 所 以 我 们 不 希望 一 直 空 
等 线程 结束 。 

可 以 调用 sleep 等 待 超时 到 期 ， 但 它 提 供 的 时 间 粒 度 是 秒 级 的 。 如 果 
希望 等 待 的 时 间 不 是 整数 秒 ， 就 需要 用 nanosleep 或 者 clock_nanosleep 函 
数 ， 它 们 两 个 提供 了 更 高 精度 的 休眠 时 间 。 


在 未 定义 CLOCK_REALTIME 的 系统 中 ， 我 们 根据 nanosleep 定 义 
clock_nanosleep。 然 而 ，FreeBSD 8.0 定义 这 个 符号 支持 clock_gettime 
和 clock_settime， 但 并 不 支持 clock_nanosleep。 (只 有 Linux 3.2.0 和 
Solaris 10 目 前 支持 clock_nanosleep。) 

另外 ， 在 未 定义 CLOCK_REALTIME 的 系统 中 ， 我 们 提供 了 我 们 自 
己 的 clock_gettime 实 现 ， 该 实现 调用 了 gettimeofday 并 把 微妙 转换 成 纳 
秒 。 

timeout 的 调用 者 需要 占有 互 斥 量 来 检查 条 件 ， 并 且 把 retry 函 数 安 排 
为 原子 操作 。retry 函 数 试图 对 同一 个 互 斥 量 进行 加 锁 。 除 非 互 斥 量 是 递 
H, EU, WÈ timeout 函数 直接 调用 retry， 会 导致 死 锁 。 


12.4.2 该 写 锁 属性 
MMS APRA, eA. AA 











pthread_rwlockattr_init 初始 化 pthread_rwlockattr_t 结 构 ， 用 
pthread_rwlockattr_destroy 反 初始 化 该 结构 。 
#include <pthread.h> 


int pthread_rwlockattr_init(pthread_rwlockattr_t *attr); 
int pthread_rwlockattr_destroy(pthread_rwlockattr_t *attr); 
两 个 函数 的 返回 值 ， ARD, TRIO; 人 否则， 返回 错误 编号 
读 写 锁 文 持 的 唯一 属性 是 进程 共享 属性 。 它 与 互 斥 量 的 进程 共享 属 
性 是 相同 的 。 融 像 互 斥 量 的 进程 共享 属性 一 样 ， 有 一 对 函数 用 于 读 取 和 
设置 读 写 锁 的 进程 共享 属性 。 
#include <pthread.h> 
int pthread_rwlockattr_getpshared(const pthread_rwlockattr_t * 
restrict attr, 
int *restrict pshared); 
int pthread_rwlockattr_setpshared(pthread_rwlockattr_t *attr, 
int pshared); 
两 个 函数 的 返回 值 : A, JRO; 否则， 返回 错误 编号 
虽然 POSIX 只 定义 了 一 个 读 写 锁 属 性 ， 但 不 同 平台 的 实现 可 以 自由 
地 定义 额外 的 、 非 标准 的 属性 。 


12.4.3 条 件 变量 属性 








Single UNIX Specification 目 前 定义 了 条 件 变 量 的 两 个 属性 : 进程 共 
享 属性 和 时 钟 属性 。 与 其 他 的 属性 对 象 一 样 ， 有 一 对 函数 用 于 初始 化 和 


反 初 始 化 条 件 变量 属性 。 
#include <pthread.h> 
int pthread_condattr_init(pthread_condattr_t *attr); 
int pthread_condattr_destroy(pthread_condattr_t *attr); 
两 个 函数 的 返回 值 : ARD, TRIO; 否则， 返回 错误 编号 
与 其 他 的 同步 属性 一 样 ， 条 件 变 量 支 持 进程 共享 属性 。 它 控制 着 条 
件 变 量 是 可 以 被 单 进程 的 多 个 线程 使 用 ， 还 是 可 以 被 多 进程 的 线程 使 
用 。 要 获取 进程 共享 属性 的 当前 值 ， 可 以 用 pthread_condattr_getpshared 
函数 。 设 置 该 值 可 以 用 pthread_condattr_setpshared 函 数 。 
#include <pthread.h> 
int pthread_condattr_getpshared(const pthread_condattr_t * 
restrict attr, 
int *restrict pshared); 
int pthread_condattr_setpshared(pthread_condattr_t *attr, 
int pshared); 
两 个 函数 的 返回 值 : ARJ, eo; AM, Wea S 
时 钟 属性 控制 计算 pthread_cond_timedwait 函 数 的 超时 参数 (tsptr) 
时 采用 的 是 哪个 时 钟 。 合 法 值 取 自 图 6-8 中 列 出 的 时 钟 ID。 可 以 使 用 
pthread_condattr_getclock 函数 获取 可 被 用 于 pthread_cond_timedwait 函数 
的 时 钟 ID， 在 使 用 pthread_cond_timedwait 函数 前 需要 用 
pthread_condattr_t 对 象 对 条 件 变量 进行 初始 化 。 可 以 用 
pthread_condattr_setclock 函 数 对 时 钟 ID 进行 修改 。 
#include <pthread.h> 
int pthread_condattr_getclock(const pthread_condattr_t * 
restrict attr, 
clockid_t *restrict clock_id); 
int pthread_condattr_setclock(pthread_condattr_t *attr, 
clockid_t clock_id); 
PAS eR CAI EVE a, EIEIO; 否则， 返回 错误 编号 
奇怪 的 是 ，Single UNIX Specification kA AT fh A EB IN EEF eh BL 
的 属性 对 象 定义 时 钟 属 性 。 


12.4.4 屏障 届 性 
屏障 也 有 属性 。 可 以 使 用 pthread_barrierattr_init 函 数 对 屏障 属性 对 


象 进行 初 始 化 ， 用 pthread_barrierattr_destroy 函 数 对 屏障 属性 对 象 进行 反 
初始 化 。 








#include <pthread.h> 
int pthread_barrierattr_init(pthread_barrierattr_t *attr); 
int pthread_barrierattr_destroy(pthread_barrierattr_t *attr); 
PAT PRAIRIE: 大 成 功 ， 返 回 0; 否则， 返回 错误 编号 
目前 定义 的 屏障 属性 只 有 进程 共 胖 属性 ， 它 控制 着 屏障 是 可 以 被 多 
进程 的 线程 使 用 ， 还 是 只 能 被 初始 化 屏障 的 进程 内 的 多 线程 使 用 。 与 其 
他 属性 对 象 一 样 ， 有 一 个 获取 属性 值 的 函数 
(pthread_barrierattr_getpshared) 和 一 个 设置 属性 值 的 函数 
(pthread_barrierattr_setpshared) 。 
#include <pthread.h> 
int pthread_barrierattr_getpshared(const pthread_barrierattr_t * 
restrict attr, 
int *restrict pshared); 
int pthread_barrierattr_setpshared(pthread_barrierattr_t *attr, 
int pshared); 
两 个 函数 的 返回 值 : 大 成 功 ， 返 回 0; 否则， 返回 错误 编号 
进程 共享 属性 的 值 可 以 是 PTHREAD_PROCESS_SHARED (多 进程 
中 的 多 个 线程 可 用 ) ， 也 可 以 是 PTHREAD_PROCESS_PRIVATE (只 有 
初始 化 屏障 的 那个 进程 内 的 多 个 线程 可 用 )。 





12.5 2A 


10.6 节 讨论 了 可 重 入 函数 和 信和 号 处 理 程序 。 线 程 在 遇 到 重 入 问题 时 
与 信号 处 理 程序 是 类 似 的 。 在 这 两 种 情况 下 ， 多 个 控制 线程 在 相同 的 时 
间 有 可 能 调用 相同 的 函数 。 

如 果 一 个 函数 在 相同 的 时 间 点 可 以 被 多 个 线程 安全 地 调用 ， 就 称 该 
函数 是 线程 安全 的 。 在 Single UNIX Specification 中 定义 的 所 有 函数 中 ， 
除了 图 12-9 中 列 出 的 函数 ， 其 他 函数 都 保证 是 线程 安全 的 。 另 外 ， 
ctermid 和 tmpnam 函 数 在 参数 传 入 空 指针 时 并 不 能 保证 是 线程 安全 的 。 
类 似 地 ， 如 果 参 数 mbstate_t 传 入 的 是 空 指针 ， 也 不 能 保证 wcrtomb 和 
wocsrtombs 函 数 是 线程 安全 的 。 

文 持 线程 安全 函数 的 操作 系统 实现 会 在 <unistd.h> 中 定义 符号 
_POSIX_THREAD_SAFE_FUNCTIONS。 应 用 程序 也 可 以 在 sysconf 函 数 
中 传 入 _SC_THREAD_SAFE_FUNCTIONS 参 数 在 运行 时 检查 是 否 支持 
线程 安全 函数 。 在 SUSv4 之 前 ， 要 求 所 有 遵循 XSI 的 实现 都 必须 文 持 线 
程 安全 函数 ， 但 是 在 SUSv4 中 ， 线 程 安全 函数 文 持 这 个 需求 已 经 要 求 具 
体 实 现 考虑 遵循 POSIX。 

操作 系统 实现 文 持 线程 安全 函数 这 个 特性 时 ， 对 POSIX.1 中 的 一 些 
非 线 程 安全 函数 ， 它 会 提供 可 蔡 代 的 线程 安全 版 本 。 图 12-10 列 出 了 这 
些 函 数 的 线程 安全 版 本 。 这 些 函 数 的 命名 方式 与 它们 的 非 线 程 安全 版 本 
的 名 字 相 似 ， 只 不 过 在 名 字 最 后 加 了 _r， 表 明 这 些 版 本 是 可 重 入 的 。 很 
多 函数 并 不 是 线程 安全 的 ， 因 为 它们 返回 的 数据 存放 在 静态 的 内 存 缓冲 
。 通 过 修改 接口 ， 要 求 调用 者 自己 提供 缓冲 区 可 以 使 函数 变 为 线程 
安全 。 

















basename 
catgets 
crypt 

dbm _clearerr 
dbm_close 
dbm_delete 
dom error 
dbm fetch 
dbm firstkey 
dbm nextkey 
dbm open 

dbm store 
dirname 
dlerror 
drand48 
encrypt 
endgrent 
endpwent 
endutxent 


getc_unlocked 


getchar_unlocked 
getdate 

getenv 

getgrent 
getgrgid 
getgrnam 


gethostent 


getlogin 


getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwuid 
getservbyname 


getservbyport 


图 12-9 POSIX.1 中 不 能 保证 线程 安全 的 函数 


getservent 
getutxent 
getutxid 
getutxline 
gmtime 
hcreate 
hdestroy 
hsearch 
inet_ntoa 
164a 
lgamma 
lgammaf 
lgammal 
localeconv 
localtime 
lrand48 
mrand48 
nftw 


nl_langinfo 
ptsname 


putc_unlocked 
putchar_unlocked 
putenv 
pututxline 
rand 

readdir 
setenv 
setgrent 
setkey 
setpwent 
setutxent 
strerror 
strsignal 
strtok 

system 
ttyname 
unsetenv 
westombs 
wetomb 





getgrgid_r localtime_r 


getgrnam_r readdir r 


getlogin_r strerror r 


getpwnam_r SErEOK: © 


getpwuid r ttyname_r 





gmtime_r 


图 12-10 替代 的 线程 安全 函数 

如 果 一 个 函数 对 多 个 线程 来 说 是 可 重 入 的 ， 束 说 这 个 函数 就 是 线程 
安全 的 。 但 这 并 不 能 说 明 对 信和 号 处 理 程序 来 说 该 函数 也 是 可 重 入 的 。 如 
果 函 数 对 异步 信号 处 理 程序 的 重 入 是 安全 的 ， 那 么 就 可 以 说 函数 是 异步 
信号 安全 的 。 我 们 在 10.6 节 中 讨论 可 重 入 函数 时 ， 图 10-4 中 的 函数 就 是 
异步 信号 安全 函数 。 

除了 图 12-10 中 列 出 的 函数 ，POSIX.1 还 提供 了 以 线程 安全 的 方式 管 
理 FILE 对 象 的 方法 。 可 以 使 用 flockfile 和 ftrylockfile 获 取 给 定 FILE 对 象 关 
联 的 锁 。 这 个 锁 是 递归 的 : 当 你 占有 这 把 锁 的 时 候 ， 还 是 可 以 再 次 获取 
该 锁 ， 而 且 不 会 导致 死 锁 。 虽 然 这 种 锁 的 具体 实现 并 无 规定 ， 但 要 求 所 
有 操作 FILE 对 象 的 标准 IO 例 程 的 动作 行为 必须 看 起 来 就 像 它们 内 部 
调用 了 flockfile 和 funlockfile。 

#include <stdio.h> 

int ftrylockfile(FILE *fp); 

返回 值 : AR, GIO; 知 不 能 获取 锁 ， 返 回 非 0 数值 

void flockfile(FILE *fp); 

void funlockfile(FILE *fp); 

虽然 标准 的 MO 例 程 可 能 从 它们 各 自 的 内 部 数据 结构 的 角度 出 发 ， 
是 以 线程 安全 的 方式 实现 的 ， 但 有 时 把 锁 开 放 给 应 用 程序 也 是 非常 有 用 
的 。 这 允许 应 用 程序 把 多 个 对 标准 WO 函数 的 调用 组 合成 原子 序列 。 当 
然 ， 在 处 理 多 个 FILE 对 象 时 ， 需 要 注意 潜在 的 死 锁 ， 需 要 对 所 有 的 锁 仔 
细 地 排序 。 

如 果 标 准 IO 例 程 都 获取 它们 各 自 的 锁 ， 那 么 在 做 一 次 一 个 字符 的 
1/O 时 就 会 出 现 严 重 的 性 能 下 降 。 在 这 种 情况 下 ， 需 要 对 每 一 个 字符 的 
读 写 操作 进行 获取 锁 和 释放 锁 的 动作 。 为 了 避免 这 种 开销 ， 出 现 了 不 加 
锁 版 本 的 基于 字符 的 标准 1/O 例 程 。 


#include <stdio.h> 

















int getchar_unlocked(void); 
int getc_unlocked(FILE *fp); 
两 个 函数 的 返回 值 : ARD, WIE Rs TBC ERA h 
错 ， 返 回 EOF 
int putchar_unlocked(int c); 
int putc_unlocked(int c, FILE *fp); 
PAT ERIE: AI, ele 和 奉 出 错 ， 返 回 EOF 
除非 被 flockfile〈 或 ftrylockfile) 和 funlockfile 的 调用 包围 ， 人 否则 尽 
量 不 要 调用 这 4 个 函数 ， 因 为 它们 会 导致 不 可 预期 的 结果 《〈 比 如 ， 由 于 
多 个 控制 线程 非 同步 访问 数据 引起 的 种 种 问题 ) 。 
一 旦 对 FILE 对 象 进 行 加 锁 ， 就 可 以 在 释放 锁 之 前 对 这 些 函 数 进 行 多 
人 以 在 多 次 的 数据 读 写 上 分 摊 总 的 加 解锁 的 开销 。 
SKH 
12-1142 78 J getenv (17.9) 的 一 个 可 能 实现 。 这 个 版 本 不 是 
可 重 入 的 。 如 果 两 个 线程 同时 调用 这 个 函数 ， 就 会 看 到 不 一 致 的 结 
oe 用 getenv 的 线程 返回 的 字符 串 都 存储 在 同一 个 静态 缓冲 区 


finclude <limits.h> 
finclude <string.h> 


#define MAXSTRINGSZ 4096 
static char envbuf [MAXSTRINGSZ]: 
extern char **environ: 


char * 
getenv (const char *name) 


| 


int i, len; 


len = strlen (name) ; 
for (1 = 0; environ[i] != NULL; i++) { 
if ((strncmp(name, environ[i], len) == 0) & 
(environ[i] [len] == '=')) { 
strncpy (envbuf, genviron(i] [lentl], MAXSTRINGSZ-1) ; 
return (envbuf) ; 


return (NULL) ; 


图 12-11 getenv 的 非 可 重 入 版 本 
图 12-12 给 出 了 getenv 的 可 重 入 的 版 本 。 这 个 版 本 叫做 getenv_r。 它 
使 用 pthread_once 函 数 来 确保 不 管 多 少 线程 同时 竞争 调用 getenv_r， 每 个 
进程 只 调用 thread_init 函 数 一 次 。12.6 节 会 详细 描述 pthread_once 函 数 。 





#include <string.h> 
#include <errno.h> 
#include <pthread.h> 
#include <stdlib.h> 


extern char **environ; 


pthread_mutex_t env_mutex; 


static pthread_once_t init_done = PTHREAD ONCE INIT; 


static void 
thread_init (void) 
{ 
pthread_mutexattr_t attr; 


pthread_mutexattr_init (&attr) ; 
pthread_mutexattr_settype(&attr, PTHREAD MUTEX_RECURSIVE) ; 
pthread_mutex_init (&env_mutex, &attr); 
pthread_mutexattr_destroy(éattr) ; 


int 
getenv_r(const char *name, char *buf, int buflen) 


{ 


int i, len, olen; 


pthread_once(&init_done, thread_init); 
len = strlen(name) ; 
pthread_mutex_lock (&env_mutex) ; 


for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp (name, environ[i], len) == 0) && 
(environ[i] [len] == '=')) { 


olen = strlen(&environ[i] [len+1]); 

if (olen >= buflen) { 
pthread_mutex_unlock (&env_mutex) ; 
return (ENOSPC) ; 

} 

strcpy (buf, &environ[i] [lent+1]); 

pthread_mutex_unlock (&env_mutex) ; 

return (0); 


} 
pthread_mutex_unlock (&env_mutex) ; 
return (ENOENT) ; 





图 12-12 eye (线程 安全 ) 版 本 

要 使 getenv_T 可 重 入 ， 需 要 改变 接口 ， 调 用 者 必须 提供 它 目 己 的 组 
THX, 这 和 样 每 个 线程 可 以 使 用 各 日 个 同 的 缓冲 区 避免 其 他 线程 的 干扰。 
但 是 ， 注 意 ， 要 想 使 getenv_r 成 为 线程 安全 的 ， o. a 需要 在 
搜索 请 求 的 字 符 时 保护 环境 不 被 修改 。 可 以 使 用 互 斥 量 ， 通 过 getenv_T 
和 putenv 函 数 对 环境 列表 的 访问 进行 串 行 化 。 

可 以 使 用 读 写 锁 ， 从 而 允许 对 getenv_r 进 行 多 次 并 发 访问 ， 但 增加 
的 并 发 性 可 能 并 不 会 在 很 大 程度 上 改善 程序 的 性 能 ， 这 里 面 有 两 个 原 
Al: 第 一 ， 环 境 列 表 通 名 并 不 会 很 长 ， 所 以 扫描 列表 时 并 不 需要 长 时 间 
地 占有 互 斥 量 ;， 第 二 ， 对 getenv 和 putenv 的 调用 也 不 是 频繁 发 生 的 ， 所 
以 改善 它们 的 性 能 并 不 会 对 程序 的 整体 性 能 产生 很 大 的 影响 。 

即使 可 以 把 getenv_Tr 变 成 线程 安全 的 ， 这 也 不 意味 着 它 对 信和 号 处 理 
程序 是 可 重 入 的 。 如 果 使 用 的 是 非 递 归 的 互 斥 量 ， 线 程 从 信号 处 理 程序 
中 调用 = getenvir 束 有 可 能 出 现 死 锁 。 如 果 信 号 处 理 程序 在 线程 执行 
getenv_r 时 中 断 了 该 线程 ， 这 时 我 们 已 经 占有 加 锁 的 env_mutex， 这 样 其 
他 线程 试 网 对 这 个 互 斥 量 的 加 锁 驶 会 被 阻塞 ， 最 终 导 致 线程 进 入 死 锁 状 
态 。 所 以 ， 必 须 使 用 递归 互 斥 量 阻 止 其 他 线程 改变 我 们 正 需要 的 数据 结 
Ky, 还 要 阻止 来 自信 和 号 处 理 程 序 的 死 锁 。 问 题 是 pthread 函 数 并 不 保证 是 
异步 信号 安全 的 ， 所 以 不 能 把 pthread 函 数 用 于 其 他 函数 ， 让 该 函数 成 为 

步 信号 安全 的 。 























12.6 线程 特定 装 


线程 特定 数据 (thread-specific data) ， 也 称 为 线程 私有 数据 
(thread-private data) ， 是 存储 和 碍 询 某 个 特定 线程 相关 数据 的 一 种 机 
制 。 我 们 把 这 种 数据 称 为 线程 特定 数据 或 线程 私有 数据 的 原因 是 ， 我 们 
希望 每 个 线程 可 以 访问 它 自 己 单 独 的 数据 副本 ， 而 不 需要 担心 与 其 他 线 
程 的 同步 访问 问题 。 

线程 模型 促进 了 进程 中 数据 和 属性 的 共享 ， 许 多 人 在 设计 线程 模型 
时 会 遇 到 各 种 及 烦 。 那 么 为 什么 有 人 想 在 这 样 的 模型 中 促进 阻止 共享 的 
接口 呢 ? 这 其 中 有 两 个 原因 。 

第 一 ， 有 时 候 需 要 维护 基于 每 线程 〈per-thread) 的 数据 。 因 为 线程 
ID 并 不 能 保证 是 小 而 连续 的 整数 ， 所 以 就 不 能 简单 地 分 配 一 个 每 线程 数 
据 数组 ， 用 线程 ID 作为 数组 的 索引 。 即 使 线程 ID 确实 是 小 而 连续 的 整 
数 ， 我 们 可 能 还 希望 有 一 些 额 外 的 保护 ， 防 止 某 个 线程 的 数据 与 其 他 线 
程 的 数据 相 混 清 。 

采用 线程 私有 数据 的 第 二 个 原因 是 ， 它 提供 了 让 基于 进程 的 接口 适 
应 多 线程 环境 的 机 制 。 一 个 很 明显 的 实例 束 是 errno。 回 忆 1.7 节 中 对 
errno 的 讨论 。 以 前 的 接口 (线程 出 现 以 前 〉 把 errno 定义 为 进程 上 下 文 
中 全 局 可 访问 的 整数 。 系 统 调用 和 库 例 程 在 调用 或 执行 失败 时 设置 
errmo， 把 它 作 为 操作 失败 时 的 附属 结果 。 为 了 让 线程 也 能 够 使 用 那些 原 
本 基于 进程 的 系统 调用 和 库 例 程 ，errno 被 重新 定义 为 线程 私有 数据 。 这 
He 一 个 线程 做 了 重 置 errno 的 操作 也 不 会 影响 进程 中 其 他 线程 的 ermo 

我 们 知道 一 个 进程 中 的 所 有 线程 都 可 以 访问 这 个 进程 的 整个 地 址 空 
间 。 除 了 使 用 寄存 器 以 外 ， 一 个 线程 没有 办 法 阻止 另 一 个 线程 访问 它 的 
数据 。 线 程 特 定数 据 也 不 例外 。 虽 然 底层 的 实现 部 分 并 不 能 阻止 这 种 访 
问 能 力 ， 但 管理 线程 特定 数据 的 函数 可 以 提高 线程 间 的 数据 独立 性 ， 使 
得 线程 不 太 容 易 访 问 到 其 他 线程 的 线程 特定 数据 。 

在 分 配 线程 特定 数据 之 前 ， 需 要 创建 与 该 数据 关联 的 键 。 这 个 键 将 
用 于 获取 对 线程 特定 数据 的 访问 。 使 用 pthread_key_create 创 建 一 个 键 。 

#include <pthread.h> 

int pthread_key_create(pthread_key_t *keyp, void (*destructor)(void 


*)); 




















返回 值 : 若 成 功 ， 返 回 0;， 否则， 返回 错误 编号 


创建 的 键 存储 在 keyp 指 同 的 内 存单 元 中 ， 这 个 键 可 以 被 进程 中 的 所 
有 线程 使 用 ， 但 每 个 线程 把 这 个 键 与 不 同 的 线程 特定 数据 地 址 进行 关 
联 。 创 建新 键 时 ， 每 个 线程 的 数据 地 址 设 为 空 值 。 

除了 创建 键 以 外 ，pthread_key_create 可 以 为 该 键 关 联 一 个 可 选择 的 
析 构 函数 。 当 这 个 线程 退出 时 ， 如 果 数 据 地 址 已 经 被 置 为 非 空 值 ， 那 么 
析 构 函数 就 会 被 调用 ， 它 唯一 的 参数 就 是 该 数据 地 址 。 如 果 传 入 的 析 构 
函数 为 空 ， 就 表明 没有 析 构 函数 与 这 个 键 关 联 。 当 线程 调用 pthread_exit 
或 者 线程 执行 返回 ， 正 常 退出 时 ， 析 构 函 数 就 会 被 调 有 用。 同样， 线程 取 
消 时 ， 只 有 在 最 后 的 清理 处 理 程序 返回 之 后 ， 析 构 函 数 才 会 被 调用 。 如 
果 线 程 调用 了 exit、_exit、_Exit 或 abort， 或 者 出 现 其 他 非 正 第 的 退出 
时 ， 束 不 会 调用 析 构 函数 。 

线程 通常 使 用 malloc 为 线程 特定 数据 分 配 内 存 。 析 构 函 数 通常 释放 
己 分 配 的 内 存 。 如 果 线 程 在 没有 释放 内 存 之 前 就 退出 了 ， 那 么 这 块 内 存 
就 会 丢失 ， 即 线程 所 属 进 程 就 出 现 了 内 存 泄漏 。 

线程 可 以 为 线程 特定 数据 分 配 多 个 键 ， 每 个 键 都 可 以 有 一 个 析 构 函 
数 与 它 关 联 。 每 个 键 的 析 构 函数 可 以 互 不 相同 ， 当 然 所 有 键 也 可 以 使 用 
相同 的 析 构 函数 。 每 个 操作 系统 实现 可 以 对 进程 可 分 配 的 键 的 数量 进行 
限制 〈 回 忆 一 下 图 12-1 中 的 PTHREAD_KEYS_MAX) 。 

线程 退出 时 ， 线 程 特定 数据 的 析 构 函数 将 按照 操作 系统 实现 中 定义 
的 顺序 被 调用 。 析 构 函 数 可 能 会 调用 另 一 个 函数 ， 该 函数 可 能 会 创建 新 
的 线程 特定 数据 ， 并 且 把 这 个 数据 与 当前 的 键 关 联 起 来 。 当 所 有 的 析 构 
函数 都 调用 完成 以 后 ， 系 统 会 检查 是 否 还 有 非 空 的 线程 特定 数据 值 与 键 
关联 ， 如 果 有 的 话 ， 再 次 调用 析 构 函数 。 这 个 过 程 将 会 一 直 重 复 直 到 线 
程 所 有 的 键 都 为 空 线程 特定 数据 值 ， 或 者 已 经 做 了 
PTHREAD_DESTRUCTOR_ITERATIONS 〈 见 图 12-1) 中 定义 的 最 大 次 
ANH. 

对 所 有 的 线程 ， 我 们 都 可 以 通过 调用 pthread_key_delete 来 取消 键 与 
线程 特定 数据 值 之 间 的 关联 关系 。 

#include <pthread.h> 

int pthread_key_delete(pthread_key_t key); 

返回 值 : 知 成 功 ， 返 回 0; 人 否则， 返回 错误 编号 

注意 ， 调 用 pthread_key_delete 并 不 会 激活 与 键 关联 的 析 构 函数 。 要 
ee eres 内 存 ， 需 要 在 应 用 程序 中 采取 额 

APR o 

需要 确保 分 配 的 键 并 不 会 由 于 在 初始 化 阶段 的 竞争 而 发 生变 动 。 下 
面 的 代码 会 导致 两 个 线程 都 调用 pthread_key_create。 


void destructor(void *); 






































pthread_key_t key; 
int init_done = 0; 
int 
threadfunc(void *arg) 
{ 
if (!init_done) { 
init_done = 1; 
err = pthread_key_create(&key, destructor); 
} 


z 
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} 

有 些 线程 可 能 看 到 一 个 键 值 ， 而 其 他 的 线程 看 到 的 可 能 是 另 一 个 不 
同 的 键 值 ， 这 取决 于 系统 是 如 何 调度 线程 的 ， 解 决 这 种 竞争 的 办 法 是 使 
用 pthread_once。 

#include <pthread.h> 

pthread_once_t initflag = PTHREAD_ONCE_INIT; 

int pthread_once(pthread_once_t *initflag, void (*initfn)(void)); 

返回 值 : AR, EO; 否则， 返回 错误 编号 

initflag 必须 是 一 个 非 本 地 变量 《如 全 局 变量 或 静态 变量 ) ， 而 且 必 
须 初 始 化 为 PTHREAD_ONCE_INIT。 

如 果 每 个 线程 都 调用 pthread_once， 系 统 就 能 保证 初始 化 例 程 initfn 
只 被 调用 一 次 ， 即 系统 首次 调用 pthread_once 时 。 创 建 键 时 避免 出 现 冲 
突 的 一 个 正确 方法 如 下 : 

void destructor(void *); 

pthread_key_t key; 

pthread_once_t init done = PTHREAD_ONCE_INIT; 

void 

thread_init(void) 

{ 











err = pthread_key_create(&key, destructor); 
} 
int 
threadfunc(void *arg) 
{ 
} 
pthread_once(&init_done, thread_init); 
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ee 
程 特 定数 据 关 联 起 来 。 可 以 通过 pthread_getspecific 函 数 获 得 线程 特定 数 
据 的 地 址 。 
#include <pthread.h> 
void *pthread_getspecific(pthread_key_t key); 
返回 值 : ARR EAHA: AASER, IK IEINULL 
int pthread_setspecific(pthread_key_t key, const void *value); 
返回 值 : AR, EO; 否则， 返回 错误 编号 
如 果 没 有 线程 特定 数据 值 与 键 关联 ，pthread_getspecific 将 返回 一 
空 指针 ， 我 们 可 以 用 这 个 返回 值 来 确定 是 否 需要 调用 
pthread_setspecific. 
实例 
图 12-11 给 出 了 getenv 的 假设 实现 。 接 着 又 给 出 了 一 个 新 的 接口 ， 提 
供 的 功能 相同 ， 不 过 它 是 线程 安全 的 〈 见 图 12-12) 。 但 是 如 果 不 修改 
应 用 程序 ， 直 接 使 用 新 的 接口 会 出 现 什 么 问题 呢 ? 这 种 情况 下 ， 可 以 使 
用 线程 特定 数据 来 维护 每 个 线程 的 数据 缓冲 区 副本 ， 用 于 存放 各 目的 返 
回 字符 串 ， 如 图 12-13 所 示 。 








tinclude <limits,h> 
finclude <string.h> 
finclude <pthread. h> 
finclude <stdlib.h> 




















#define MAXSTRINGSZ 4096 


static pthread_key t key; 
static pthread_once_t init_done = PTHREAD ONCE_INIT; 
pthread_mutex_t env_mutex = PTHREAD MUTEX_INITIALIZER; 


extern char **environ; 


static void 
thread_init (void) 
{ 
pthread_key_create(&key, free); 


char * 
getenv(const char *name) 
{ 
int i, len; 
char *envbuf; 


pthread_once(&init_done, thread_init); 
pthread_mutex_lock (&env_mutex) ; 
envbuf = (char *)pthread_getspecific (key); 
if (envbuf == NULL) { 
envbuf = malloc (MAXSTRINGSZ) ; 
if (envbuf == NULL) { 
pthread_mutex_unlock (&env_mutex) ; 
return (NULL) ; 
} 
pthread_setspecific(key, envbuf) ; 
} 
len = strlen(name) ; 
for (i = 0; environ[i] != NULL; i++) { 
if ((strncmp (name, environ[i], len) == 0) && 
(environ[i] [len] == '=')) { 
strncpy(envbuf, &environ[i] [lent+t1], MAXSTRINGSZ-1) ; 
pthread_mutex_unlock (&env_mutex) ; 
return (envbuf) ; 


} 


pthread_mutex_unlock (&env_mutex) ; 
return (NULL); 





图 12-13 线程 安全 的 getenv 的 兼容 版 本 

我 们 使 用 pthread_once 来 确保 只 为 我 们 将 使 用 的 线程 特定 数据 创建 
一 个 键 。 如 果 pthread_getspecific 返回 的 是 空 指 针 ， 束 需要 先 分配 内 存 绥 
冲 区 ， 然 后 再 把 键 与 该 内 存 缓冲 区 关联 。 人 否则， 如果 返回 的 不 是 空 指 
针 ， 就 使 用 pthread_getspecific 返 回 的 内 存 缓冲 区 。 对 析 构 函数 ， 使 用 
free 来 释放 之 前 由 malloc 分 配 的 内 存 。 只 有 当 线 程 特 定数 据 值 为 非 空 
时 ， 析 构 函数 才 会 被 调用 。 

注意 ， 虽 然 这 个 版 本 的 getenv 是 线程 安全 的 ， 但 它 并 不 是 异步 信和 号 
安全 的 。 对 信和 号 处 理 程 序 而 言 ， 即 使 使 用 递归 的 互 斥 量 ， 这 个 版 本 的 
getenv ”也 不 可 能 是 可 重 入 的 ， 因 为 它 调 用 了 malloc， 而 malloc 函 数 本 母 
并 不 是 异步 信号 安全 的 。 








12.7 取消 选项 


有 两 个 线程 属性 并 没有 包含 在 pthread_attr_t 结 构 中 ， 它 们 是 可 取消 
状态 和 可 取消 类 型 。 这 两 个 属性 影响 着 线程 在 啊 应 pthread_cancel 函 数 调 
FAI PRB SA TOY COILS) 。 

可 取消 状态 属性 可 以 是 PTHREAD_CANCEL_ENABLE， 也 可 以 是 
PTHREAD_CANCEL_DISABLE。 线 程 可 以 通过 调用 
pthread_setcancelstate 修 改 它 的 可 取消 状态 。 

#include <pthread.h> 

int pthread_setcancelstate(int state, int *oldstate); 

返回 值 : ERJ, eo; 人 否则， 返回 错误 编号 

pthread_setcancelstate 把 当前 的 可 取消 状态 设置 为 state， 把 原来 的 可 
取消 状态 存储 在 由 oldstate 指 向 的 内 存 蛙 元 ， 这 两 步 是 一 个 原子 操作 。 

回忆 11.5 节 ，pthread_cancel 调 用 并 不 等 竺 线程 终止 。 在 默认 情况 
下 ， 线 程 在 取消 请 求 发 出 以 后 还 是 继续 运行 ， 直 到 线程 到 达 某 个 取消 
点 。 取 消 点 是 线程 检查 它 是 否 被 取消 的 一 个 位 置 ， 如 果 取 消 了 ， 则 按照 
请 求 行事 。POSIX.1 保 证 在 线程 调用 图 12-14 中 列 出 的 任何 函数 时 ， 取 消 
点 都 会 出 现 。 














accept 

al0 suspend 
clock nanosleep 
close 

connect 

creat 


fentl 


fdatasync 
fsync 
lockf 

mq receive 
mq_send 


mq timedreceive 





当 状 态 设 为 PTHREAD_CANCEL_DISABLE 时 ， 对 pthread_cancel 的 调用 


mq timedsend 
MSgrCV 
msgsnd 
msync 
nanosleep 
open 
openat 
pause 
poll 
pread 
pselect 





pthread cond timedwait 


pthread cond wait 





pthread join 
pthread testcancel 
pwrite 

read 

readv 

recy 

recvfrom 
recvmsg 
select 

sem timedwait 
sem wait 

send 

sendmsg 


图 12-14 POSIX.1 定 义 的 取消 点 
线程 启动 时 默认 的 可 取消 状态 是 PTHREAD_CANCEL ENABLE。 





sendto 
sigsuspend 
sigtimedwait 
sigwait 
sigwaitinfo 
Sleep 

system 
tedrain 











并 不 会 杀 死 线程 。 相 反 ， 取 消 请 求 对 这 个 线程 来 说 还 处 于 挂 起 状态 ， 
取消 状态 再 次 变 为 PTHREAD_ CANCEL ENABLE 时 ， 线 程 将 在 下 一 个 
取消 点 上 对 所 有 挂 起 的 取消 请 求 进行 处 理 。 
除了 图 12-14 中 列 出 的 函数 ，POSIX.1 还 指定 了 图 12-15 中 列 出 的 函 
数 作为 可 选 的 取消 点 。 
图 12-15 中 列 出 的 有 些 函 数 并 没有 在 本 书 中 进一步 讨论 ， 例 如 ， 处 





理 消息 分 类 和 宽 字 符 集 的 函数 。 
如 果 应 用 程序 在 很 长 的 一 段 时 间 内 都 不 会 调用 图 12-14 或 图 12-15 中 





的 函数 〈 如 数学 计算 领域 的 应 用 程序 ) ， 那 么 你 可 以 调用 





pthread_testcancel 函 数 在 程序 中 添加 自己 的 取消 点 。 
#include <pthread.h> 


void pthread_testcancel(void); 


调用 pthread_testcancel 时 ， 如 果 有 某 个 取消 请 求 正 处 于 挂 起 状态 ， 


而 且 取 消 并 没有 置 为 无 效 ， 那 么 线程 就 会 被 取消 。 但 是 ， 如 果 取 消 被 置 


为 无 效 ，pthread_testcancel 调 用 就 没有 任何 效果 了 。 
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access 
catclose 
catgets 
catopen 
chmod 
chown 
closedir 
closelog 
ctermid 
dbm_close 
dbm_delete 
dbm_fetch 
dbm_nextkey 
dbm_open 
dbm_store 
dlclose 
dlopen 
dprintf 
endgrent 
endhostent 
endnetent 
endprotoent 
endpwent 
endservent 
endutxent 
faccessat 
fchmod 
fchmodat 
fchown 
fchownat 
fclose 
fentl 
fflush 
fgetc 
fgetpos 
fgets 
fgetwc 
fgetws 
fmtmsg 
fopen 
fpathconf 
fprintf 
fputc 
fputs 
fputwe 
fputws 
fread 
freopen 
fscanf 
fseek 


fseeko 
fsetpos 

fstat 

fstatat 

ftell 

ftello 
futimens 
fwprintf 
fwrite 
fwscanf 
getaddrinfo 
getc 
getc_unlocked 
getchar 
getchar unlocked 
getcwd 
getdate 
getdelim 
getgrent 
getgrgid 
getgrgid r 
getgrnam 
getgrnam r 
gethostent 
gethostid 
gethostname 
getline 
getlogin 
getlogin r 
getnameinfo 
getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwnam r 
getpwuid 
getpwuid r 
getservbyname 
getservbyport 
getservent 
getutxent 
getutxid 
getutxline 
getwc 


getwchar 

glob 

iconv_close 
iconv_open 

ioctl 

link 

linkat 

lio listio 

localtime 
localtime r 

lockf 

lseek 

lstat 

mkdir 

mkdirat 

mkdtemp 

mkfifo 

mkfifoat 

mknod 

mknodat 

mkstemp 

mktime 

nftw 

opendir 

openlog 

pathconf 

pclose 

perror 

popen 

posix fadvise 

posix fallocate 
posix _madvise 

posix _openpt 

posix spawn 
posix_spawnp 

posix typed mem open 
printf 

psiginfo 

psignal 
pthread_rwlock_rdlock 
pthread rwlock_timedrdlock 
pthread rwlock timedwrlock 
pthread rwlock wrlock 
putc 

putc_unlocked 
putchar 

putchar unlocked 
puts 

pututxline 


putwe 
putwchar 
readdir 
readdir r 
readlink 
readlinkat 
remove 
rename 
renameat 
rewind 
rewinddir 
scandir 
scanf 
seekdir 
semop 
setgrent 
sethostent 
setnetent 
setprotoent 
setpwent 
setservent 
setutxent 
stat 
strerror 
strerror_r 
strftime 
symlink 
symlinkat 
sync 
syslog 
tmpfile 
ttyname 
ttyname_r 
tzset 
ungetc 
ungetwc 
unlink 
unlinkat 
utimensat 
utimes 
vdprintf 
viprintf 
viwprintf 
vprintf 
vwprintf 
wesftime 
wordexp 
wprintf 
wscanf 





图 12-15 POSIX.1 定 义 的 可 选取 消 点 

我 们 所 描述 的 默认 的 取消 类 型 也 称 为 推迟 取消 。 调 用 pthread_cancel 
以 后 ， 在 线程 到 达 取 消 点 之 前 ， 并 不 会 出 现 真正 的 取消 。 可 以 通过 调用 
pthread_setcanceltype 来 修改 取消 类 型 。 

#include <pthread.h> 

int pthread_setcanceltype(int type, int *oldtype); 

返回 值 : ERJ, eo; 人 否则， 返回 错误 编号 

pthread_setcanceltype 函 数 把 取消 类 型 设置 为 type《〈 类 型 参数 可 以 是 
PTHREADCANCEL DEFERRED， 也 可 以 是 
PTHREAD_CANCEL_ASYNCHRONOUS) ， 把 原来 的 取消 类 型 返回 到 
oldtype 指 回 的 整 型 单元 。 

异步 取消 与 推迟 取消 不 同 ， 因 为 使 用 异步 取消 时 ， 线 程 可 以 在 任意 
时 间 撤 消 ， 不 是 非得 过 到 取消 点 才能 被 取消 。 








12.8 线程 和 信号 


即使 是 在 基于 进程 的 编程 范 型 中 ， 信 号 的 处 理 有 时 候 也 是 很 复杂 
的 。 把 线程 引入 编程 范 型 ， 就 使 信号 的 处 理 变 得 更 加 复杂 。 

每 个 线程 都 有 上 自己 的 信号 屏蔽 字 ， 但 是 信号 的 处 理 是 进程 中 所 有 线 
程 共享 的 。 这 意味 着 单个 线程 可 以 阻止 某 些 信号 ， 但 当 某 个 线程 修改 了 
与 菏 个 给 定 信 号 相关 的 处 理 行为 以 后 ， 所 有 的 线程 都 必须 共享 这 个 处 理 
行为 的 改变 。 这 样 ， 如 果 一 个 线程 选择 忽略 某 个 给 定 信 号 ， 那 么 另 一 个 
线程 就 可 以 通过 以 下 两 种 方式 撤消 上 述 线程 的 信号 选择 : 恢复 信号 的 默 
认 处 理 行 为 ， 或 者 为 信号 设置 一 个 新 的 信号 处 理 程序 。 

进程 中 的 信号 是 递送 到 单个 线程 的 。 如 果 一 个 信号 与 硬件 故障 相 
关 ， 那 么 该 信号 一 般 会 被 发 送 到 引起 该 事件 的 线程 中 去 ， 而 其 他 的 信和 号 
则 被 发 送 到 任意 一 个 线程 。 

10.12 节 讨 论 了 进程 如 何 使 用 sigprocmask 函数 来 阻止 信号 发 送 。 然 
而 ，sigprocmask 的 行为 在 多 线程 的 进程 中 并 没有 定义 ， 线 程 必须 使 用 
pthread_sigmask. 

#include <signal.h> 

int pthread_sigmask(int how, const sigset_t *restrict set, 

sigset_t *restrict oset); 
返回 值 : ERHI, Beo; 人 否则， 返回 错误 编号 

pthread_sigmask 函 数 与 sigprocmask 函 数 基 本 相同 ， 不 过 
pthread_sigmask 工 作 在 线程 中 ， 而 且 失 败 时 返回 错误 码 ， 不 再 像 
sigprocmask 中 那样 设置 errno 并 返回 -1。set 参 数 包 含 线 程 用 于 修改 信号 
屏蔽 字 的 信号 集 。how 参 数 可 以 取 下 列 3 个 值 之 一 : SIG_BLOCK， 把 信 
号 集 添 加 到 线程 信号 屏蔽 字 中 ，SIG_SETMASK， 用 信号 集 蔡 换 线 程 的 
(as Feit; SIG_UNBLOCK， 从 线程 信号 屏蔽 字 中 移 除 信号 集 。 如 果 
oset 参 数 不 为 空 ， 线 程 之 前 的 信号 屏蔽 字 束 存储 在 它 指 癌 的 sigset_t 结 构 
中 。 线 程 可 以 通过 把 set 参 数 设 置 为 NULL， 并 把 oset 参 数 设 置 为 sigset_t 
a 来 获取 当前 的 信号 屏蔽 字 。 这 种 情况 中 的 how 参 数 会 被 忽 


线程 可 以 通过 调用 sigwait 等 待 一 个 或 多 个 信号 的 出 现 。 
#include <signal.h> 
int sigwait(const sigset_t *restrict set, int *restrict signop); 


返回 值 : 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 



































set 人 参数 指定 了 线程 等 待 的 信号 集 。 返 回 时 ，signop 指 向 的 整数 将 包 
含 发 送信 号 的 数量 。 

如 果 信 号 集中 的 某 个 信号 在 sigwait 调 用 的 时 候 处 于 挂 起 状态 ， 那 么 
sigwait 将 无 阻塞 地 返回 。 在 返回 之 前 ，sigwait 将 从 进程 中 移 除 那 些 处 于 
挂 起 等 待 状态 的 信号 。 如 果 有 具体 实现 文 持 排队 信号 ， 并 且 信 和 号 的 多 个 实 
人 
续 排 队 。 

为 了 避免 错误 行为 有 发生， 线程 在 调用 sigwait 之 前 ， 必 须 阻 塞 那些 
它 正 在 等 待 的 信号 。sigwait 函 数 会 原子 地 取消 信号 集 的 阻 奢 状态 ， 直 到 
有 新 的 信号 被 递送 。 在 返回 之 前 ，sigwait 将 恢复 线程 的 信号 屏蔽 字 。 如 
果 信 号 在 sigwait 被 调用 的 时 候 没 有 被 阻塞 ， 那 么 在 线程 完成 对 sigwait 
P a a 
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使 用 sigwait 的 好 处 在 于 它 可 以 人 简化 信号 处 理 ， 人 允许 把 异步 产生 的 信 
号 用 同步 的 方式 处 理 。 为 了 防止 信号 中 断 线程 ， 可 以 把 信号 加 到 每 个 线 
程 的 信号 屏蔽 字 中 。 然 后 可 以 安排 专用 线程 处 理 信 写 。 这 些 专用 线程 可 
以 进行 函数 调用 ， 不 需要 担心 在 信号 处 理 程序 中 调用 哪些 函数 是 安全 
的 ， 因 为 这 些 函 数 调 用 来 自 正 常 的 线程 上 下 文 ， 而 非 会 中 断 线 程 正常 执 
行 的 传统 信号 处 理 程序 。 

如 果 多 个 线程 在 sigwait 的 调用 中 因 等 竺 同一 个 信号 而 阻塞 ， 那 么 
在 信号 递送 的 时 候 ， 就 只 有 一 个 线程 可 以 从 sigwait 中 返回 。 如 果 一 个 
言 号 被 捕获 (例如 进程 通过 使 用 sigaction 建 立 了 一 个 信号 处 理 程序 ) ， 
而 且 一 个 线程 正在 sigwait 调 用 中 等 竺 同一 信号 ， 那 么 这 时 将 由 操作 系统 
实现 来 决定 以 何 种 方式 递送 信号 。 操 作 系 统 实 现 可 以 让 sigwait 返回 ， 
也 可 以 激活 信号 处 理 程序 ， 但 这 两 种 情况 不 会 同时 发 生 。 

要 把 信号 发 送 给 进程 ， 可 以 调用 kill ( 见 10.9 节 ) 。 要 把 信号 发 送 给 
线程 ， 可 以 调用 pthread_kill。 

#include <signal.h> 

int pthread_kill(pthread_t thread, int signo); 

返回 值 : AR, EO; 否则， 返回 错误 编号 

可 以 传 一 个 0 值 的 signo 来 检查 线程 是 否 存在 。 如 采信 号 的 默认 处 理 
动作 是 终止 该 进程 ， 那 么 把 信号 传递 给 东 个 线程 仍然 会 杀 死 整个 进程 。 

注意 ， 闹 钟 定 时 器 是 进程 资源 ， 并 且 所 有 的 线程 共享 相同 的 立 钟 。 
所 以 ， 进 程 中 的 多 个 线程 不 可 能 互 不 干扰 (或 互 不 合作 〉 地 使 用 立 钟 定 
时 器 《〈 这 是 习题 12.6 的 内 容 ) 。 

实例 

回忆 图 10-23 所 示 的 程序 ， 我 们 等 待 信号 处 理 程 序 设 置 标志 表明 主 
































程序 应 该 退出 。 唯 一 可 运行 的 控制 线程 就 是 主线 程 和 信号 处 理 程序 ， 所 
以 阻塞 信号 足以 避免 错失 标志 修改 。 在 线程 中 ， 我 们 需要 使 用 互 斥 量 来 
保护 标志 ， 如 图 12-16 中 的 程序 所 示 。 


finclude "apue ,hm 
tinclude <pthread.h> 


int quitflag;  /* set nonzero by thread */ 
sigset_t © mask; 


pthread mutex t lock = PTHREAD MUTEX INITIALIZER; 
pthread cond t waitloc = PTHREAD COND INITIALIZER; 


void * 
thr_fn(void *arg) 
| 


int err, signo; 


for (ri) | 
err = sigwait (damask, &signo); 
if (err != 0) 
err exit(err, "sigwait failed"); 


switch (signo) { 

case SIGINT: 
printf ("\ninterrupt\n"); 
break; 


case SIGQUIT: 
pthread_mutex_lock (&lock) ; 
quitflag = 1; 
pthread_mutex_unlock (&lock) ; 
pthread_cond_signal (&waitloc) ; 
return (0); 


default: 
printf ("unexpected signal %d\n", signo); 
exit (1); 


int 

main (void) 

{ 
int err; 
sigset_t oldmask; 
pthread_t tae? 


sigemptyset (&mask) ; 

sigaddset (&mask, SIGINT); 

sigaddset (&mask, SIGQUIT); 

if ((err = pthread sigmask (SIG BLOCK, &mask, &oldmask)) != 0) 
err exit(err, "SIG BLOCK error"); 


err = pthread_create(&tid, NULL, thr_fn, 0); 
if (err != 0) 
err exit (err, "can't create thread"); 


pthread_mutex_lock (&lock) ; 
while (quitflag == 0) 

pthread_cond_wait (&waitloc, &lock) ; 
pthread_mutex_unlock (&lock) ; 


/* SIGQUIT has been caught and is now blocked; do whatever */ 
quitflag = 0; 


/* reset signal mask which unblocks SIGQUIT */ 

if (sigprocmask(SIG_SETMASK, &oldmask, NULL) < 0) 
err_sys("SIG SETMASK error"); 

exit (0); 























图 12-16 同步 信号 处 理 

我 们 不 用 依赖 信号 处 理 程序 中 断 主 控 线 程 ， 有 专门 的 独立 控制 线程 
进行 信号 处 理 。 在 互 斥 量 的 保护 下 改动 quitflag 的 值 ， 这 样 主 探 线程 不 会 
在 调用 pthread_cond_signal 时 错失 唤醒 调用 。 在 主 控 线 程 中 使 用 相同 的 
互 斥 量 来 检查 标志 的 值 ， 并 且 原 子 地 释放 互 斥 量 ， 等 竺 条件 的 发 生 。 

注意 ， 在 主线 程 开 始 时 阻塞 SIGINT 和 SIGQUIT。 当 创建 线程 进行 
信号 处 理 时 ， 新 建 线 程 继 承 了 现 有 的 信号 屏蔽 字 。 因 为 sigwait 会 解除 
信号 的 阻塞 状态 ， 所 有 只 有 一 个 线程 可 以 用 于 信号 的 接收 。 这 可 以 使 我 
们 对 主线 程 进行 编码 时 不 必 担 心 来 自 这 些 信 号 的 中 断 。 

运行 这 个 程序 可 以 得 到 与 图 10-23 类 似 的 输出 结果 : 


























$ ./a.out 

^? mA PETIT 

^? 再 次 输入 中 断 字 符 
interrupt 

interrupt 

^? 再 次 输入 中 断 字 符 
N$ 现在 用 退出 符 终 止 


interrupt 


12.9 线程 和 fork 


当 线 程 调用 fork 时 ， 就 为 子 进程 创建 了 整个 进程 地 址 空间 的 副本 。 
回忆 8.3 节 中 讨论 的 写 时 复制 ， 子 进程 与 父 进程 是 完全 不 同 的 进程 ， 只 
要 两 者 都 没有 对 内 存 内 容 做 出 改动 ， 父 进程 和 子 进程 之 间 还 可 以 共享 内 
存 页 的 副本 。 

子 进 程 通过 继承 整个 地 址 空间 的 副本 ， 还 从 父 进程 那儿 继承 了 每 个 
互 太 量 、 读 写 锁 和 条 件 变量 的 状态 。 如 果 父 进程 包含 一 个 以 上 的 线程 ， 
HDFT fore El 以 后 ， 如 果 紧 接着 不 是 马上 调用 exec 的 话 ， 束 需要 清 
理 锁 状态 。 

在 子 进程 内 部 ， 只 存在 一 个 线程 ， 它 是 由 父 进程 中 调用 fork 的 线程 
的 副本 构成 的 。 如 果 父 进程 中 的 线程 占有 锁 ， 子 进程 将 同样 占有 这 些 
锁 。 问 题 是 子 进程 并 不 包含 占有 锁 的 线程 的 副本 ， 所 以 子 进程 没有 办 法 
知道 它 占 有 了 哪些 锁 、 需 要 释放 哪些 锁 。 

如 果子 进程 从 fork 返 回 以 后 蕊 上 调用 其 中 一 个 exec 函 数 ， 束 可 以 避 
免 这 样 的 问题 。 这 种 情况 下 ， 旧 的 地 址 空间 就 被 丢弃 ， 所 以 锁 的 状态 无 
关 紧 要 。 但 如 果子 进程 需要 继续 做 处 理工 作 的 话 ， 这 种 策略 束 行 不 通 ， 
还 需要 使 用 其 他 的 策略 。 

在 多 线程 的 进程 中 ， 为 了 避免 不 一 致 状态 的 问题 ，POSIX.1 声 明 ， 
在 fork 返 回 和 子 进程 调用 其 中 一 个 exec 函 数 之 间 ， 子 进程 只 能 调用 异步 
信号 安全 的 函数 。 这 就 限制 了 在 调用 exec 之 前 子 进程 能 做 什么 ， 但 不 涉 
及 子 进程 中 锁 状态 的 问题 。 

要 清除 锁 状 态 ， 可 以 通过 调用 pthread_atfork 消 数 建立 fork 处 理 程 
FFs 

#include <pthread.h> 

int pthread_atfork(void (*prepare)(void), void (*parent)(void), 

void (*child)(void)); 
返回 值 : ARD, WO; 否则 ， 返 回 错误 编号 

用 pthread_atfork 函 数 最 多 可 以 安装 3 个 帮助 清理 锁 的 函数 。prepare 
fork 处 理 程序 由 父 进 程 在 fork 创 建 子 进程 前 调用 。 这 个 fork 处 理 程序 的 任 
务 是 获取 父 进 程 定义 的 所 有 锁 。parent fork 处 理 程 序 是 在 fork 创建 子 进 
程 以 后 、 返 回 之 前 在 父 进程 上 下 文中 调用 的 。 这 个 fork 处 理 程 序 的 任务 
是 对 prepare fork 处 理 程序 获取 的 所 有 锁 进 行 解锁 。child fork 处 理 程 序 在 
fork 返 回 之 前 在 子 进程 上 下 文中 调用 。 与 parent fork 处 理 程 序 一 样 ，child 

















fork 处 理 程序 也 必须 释放 prepare fork 处 理 程序 获取 的 所 有 锁 。 
注意 ， 不 会 出 现 加 锁 一 次 解锁 两 次 的 情况 ， 虽 然 看 起 来 也 许 会 出 
现 。 子 进程 地 址 空间 在 创建 时 束 得 到 了 父 进程 定义 的 所 有 锁 的 副本 。 
为 prepare fork 处 理 程 序 获取 了 所 有 的 锁 ， 父 进程 中 的 内 存 和 子 进程 中 的 
内 存 内 容 在 开始 的 时 候 是 相同 的 。 当 父 进 程 和 子 进 程 对 它们 锁 的 副本 进 
程 解锁 的 时 候 ， 新 的 内 存 是 分 配给 子 进 程 的 ， 父 进程 的 内 存 内 容 是 复制 
到 子 进程 的 内 存 中 〈 写 时 复制 )》， 所 以 我 们 就 会 陷入 这 样 的 假象 ， 看 起 
来 父 进程 对 它 所 有 的 锁 的 副本 进行 了 加 锁 ， 子 进程 对 它 所 有 的 锁 的 副本 
进行 了 加 锁 。 父 进程 和 子 进 程 对 在 不 同 内 存单 元 的 重复 的 锁 都 进行 了 解 
锁 操 作 ， 就 好 像 出 现 了 下 列 事件 序列 。 
(1) 父 进程 获取 所 有 的 锁 。 
(2) 子 进 程 获取 所 有 的 锁 。 
(3) 父 进 程 释放 它 的 锁 。 
(4) 子 进程 释放 它 的 锁 。 
可 以 多 次 调用 pthread_atfork 函 数 从 而 设置 多 套 fork 处 理 程 序 。 如 果 
不 需要 使 用 其 中 某 个 处 理 程序 ， 可 以 给 特定 的 处 理 程序 参数 传 入 空 指 
针 ， 它 就 不 会 起 任何 作用 了 。 使 用 多 个 fork 处 理 程序 时 ， 处 理 程序 的 调 
用 顺序 并 不 相同 。parent 和 child fork 处 理 程 序 是 以 它们 注册 时 的 顺序 进 
行 调 用 的 ， 而 prepare fork 处 理 程 序 的 调用 顺序 与 它们 注册 时 的 顺序 相 
反 。 这 样 可 以 允许 多 个 模块 注册 它们 目 己 的 fork 处 理 程 序 ， 而 且 可 以 保 
持 锁 的 层次 。 
例如 ,假设 模块 A 调用 模块 B 中 的 函数 ， 而 且 每 个 模块 有 自己 的 一 
套 锁 。 如 果 锁 的 层次 是 A 在 B 之 前 ， 模 块 B 必 须 在 模块 A 之 前 设置 它 的 
fork 处 理 程序 。 当 父 进程 调用 fork 时 ， 就 会 执行 以 下 的 步 又， 假设 子 进 
程 在 父 进程 之 前 运行 : 
(1) 调用 模块 A 的 prepare fork 处 理 程序 获取 模块 A 的 所 有 锁 。 
(2) 调用 模块 B 的 prepare fork 处 理 程 序 获取 模块 B 的 所 有 和 锁 。 
(3) 创建 子 进 程 。 
(4) 调用 模块 B 中 的 child fork 处 理 程序 释放 子 进程 中 模块 B 的 所 有 


锁 。 
调用 模块 A 中 的 child fork 处 理 程序 释放 子 进 程 中 模块 A 的 所 有 


(5 
锁 。 
(6) fork ZUR E FT HEFE. 
a (7) 调用 模块 B 中 的 parent fork 处 理 程 序 释 放 父 进程 中 模块 了 的 所 
锁 。 
i (8) 调用 模块 A 中 的 parent fork 处 理 程序 来 释放 父 进 程 中 模块 A 的 
所 有 锁 。 


























WY 


(9) fork ek BC [Fl BSC HERE o 

如 果 fork 处 理 程 序 是 用 来 清理 锁 状 态 的 ， 那 么 又 由 谁 来 负责 清理 条 
件 变 量 的 状态 呢 ? 在 有 些 操作 系统 的 实现 中 ， 条 件 变 量 可 能 并 不 需要 做 
任何 清理 。 但 是 有 些 操作 系统 实现 把 锁 作 为 条 件 变量 实现 的 一 部 分 ， 这 
种 情况 下 的 条 件 变 量 就 需要 清理 。 问 题 是 目前 不 存在 允许 清理 锁 状 态 的 
接口 。 如 果 锁 是 通 入 到 条 件 变量 的 数据 结构 中 的 ， 那 么 在 调用 fork 之 后 
就 不 能 使 用 条 件 变 量 ， 因 为 还 没有 可 移植 的 方法 对 锁 进 行 状态 清理 。 男 
外 ， 如 果 操 作 系 统 的 实现 是 使 用 全 局 锁 保护 进程 中 所 有 的 条 件 变 量 数据 
结构 ， 那 么 操作 系统 实现 本 身 可 以 在 fork 库 例 程 中 做 清理 锁 的 工作 ， 但 
是 应 用 程序 不 应 该 依赖 操作 系统 实现 中 类 似 这 样 的 细节 。 


实例 
图 12-17 中 的 程序 描述 了 如 何 使 用 pthread_atfork 和 fork 处 理 程序 。 














finclude "apue ,hn 
tinclude <pthread, h> 


pthread mutex t lockl = PTHREAD MUTEX INITIALIZER; 
pthread mutex t lock2 = PTHREAD MUTEX INITIALIZER; 


void 


prepare (void) 


{ 


int err; 


printf ("preparing locks...\n"); 


void 


if ((err = pthread_mutex_lock(&lockl)) != 0) 
err cont (err, "can't lock lockl in prepare handler"); 
if ((err = pthread_mutex_lock(&lock2)) != 0) 


err cont (err, “can't lock lock2 in prepare handler"); 


parent (void) 


{ 


void 
chil 
{ 


int err; 


printf ("parent unlocking locks...\n"); 

if ((err = pthread_mutex_unlock(&lockl)) != 0) 
err_cont(err, "can't unlock lockl in parent handler") 

if ((err = pthread_mutex_unlock(&lock2)) != 0) 


err_cont(err, "can't unlock lock2 in parent handler") 


d(void) 
int. err; 


printf (“child unlocking Lacka ov Wg 


if ((err = pthread_mutex_unlock(&lockl)) != 0) 
err_cont(err, "can't unlock lockl in child handler"); 
if ((err = pthread_mutex_unlock(&lock2)) != 0) 


err cont(err, "can't unlock lock2 in child handler") 


void * 
thr_fn(void *arg) 


{ 


int 


printf ("thread started...\n"); 


pause(); 
return (0); 


main (void) 


{ 


int err; 
pid_t pid; 

pthread_t Eidi 

if ((err = pthread_atfork (prepare, parent, child)) != 0) 


err _ exit (err, "can't install fork handlers"); 
if ((err = pthread_create(&tid, NULL, thr_fn, 0)) != 0) 


` 


~ 


err exit(err, "can't create thread"); 


Sleep (2) ; 
printf ("parent about to fork,..\n"); 


if ((pid = fork()) < 0) 

err quit ("fork failed"); 
else if (pid == 0)  /* child */ 

printf ("child returned from fork\n"); 
else  /* parent */ 

printf ("parent returned from fork\n"); 
exit (0) ; 


图 12-17 pthread_atfork 实 例 

图 12-17 中 定义 了 两 个 互 斥 量 ，lock1 和 lock2，prepare fork 处 理 程序 
获取 这 两 把 锁 ，child fork 处 理 程 序 在 子 进程 上 下 文中 释放 它们 ，parent 
fork 处 理 程序 在 父 进程 上 下 文中 释放 它们 。 

运行 该 程序 ， 得 到 如 下 输出 : 

$ ./a.out 

thread started... 

parent about to fork... 

preparing locks... 

child unlocking locks... 

child returned from fork 

parent unlocking locks... 

parent returned from fork 

可 以 看 到 ，prepare fork 处 理 程 序 在 调用 fork 以 后 运行 ，child fork 处 
理 程 序 在 fork 调 用 返回 到 子 进 程 之 前 运行 ，parent fork 处 理 程序 在 fork 调 
用 返回 给 父 进程 之 前 运行 。 

虽然 pthread_atfork 机 制 的 意 网 是 使 fork 之 后 的 锁 状 态 保持 一 致 ， 但 
它 还 是 存在 一 些 不 足 之 处 ， 只 能 在 有 限 情况 下 可 用 。 











没有 很 好 的 办 法 对 较 复 杂 的 同步 对 象 〈 如 条 件 变量 或 者 屏障 ) 进 
行 状态 的 重新 初始 化 。 

。 某 些 错误 检查 的 互 斥 量 实现 在 child fork 处 理 程 序 试图 对 被 父 进程 
加 锁 的 互 斥 量 进行 解锁 时 会 产生 错误 。 

“递归 互 斥 量 不 能 在 child fork 处 理 程序 中 清理 ， 因 为 没有 办 法 确定 
该 互 斥 量 被 加 锁 的 次 数 。 

如 果子 进程 只 允许 调用 异步 信号 安全 的 函数 ，child fork 处 理 程序 
就 不 可 能 清理 同步 对 象 ， 因 为 用 于 操作 清理 的 所 有 函数 都 不 是 异步 信和 号 
安全 的 。 实 际 的 问题 是 同步 对 象 在 某 个 线程 调用 fork 时 可 能 处 于 中 间 状 
态 ， 除 非 同步 对 象 处 于 一 致 状态 ， 人 否则 无 法 被 清理 。 

“如果 应 用 程序 在 信号 处 理 程序 中 调用 了 fork 〈 这 是 合法 的 ， 因 为 
fork 本 身 是 异步 信号 安全 的 ) ，pthread_atfork 注 册 的 fork 处 理 程 序 只 能 
调用 异步 信号 安全 的 函数 ， 否 则 结果 将 是 未 定义 的 。 


























12.10 线程 和 LO 


3.11 节 介绍 了 pread 和 pwrite 函 数 。 这 些 函 数 在 多 线程 环境 下 是 非常 
有 用 的 ， 因 为 进程 中 的 所 有 线程 共享 相同 的 文件 描述 符 。 
考虑 两 个 线程 ， 在 同一 时 间 对 同一 个 文件 描述 符 进 行 读 写 操作 。 





线程 A 线程 B 
lseek(fd, 300, SEEK_SET); lseek(fd, 700, 
SEEK_SET); 
read(fd, buf1, 100); read(fd, buf2, 100); 


如 果 线 程 A 执 行 lseek 然 后 线程 B 在 线程 A 调用 read 之 前 调用 lseek， 那 
么 两 个 线程 最 终 会 读 取 同一 条 记录 。 很 显然 这 不 是 我 们 希望 的 。 

为 了 解决 这 个 问题 ， 可 以 使 用 pread， 使 偏 移 量 的 设 定 和 数据 的 读 
取 成 为 一 个 原子 操作 。 

线程 A 线程 B 

pread(fd, buf1, 100, 300); pread(fd, buf2, 100, 700); 

使 用 pread 可 以 确保 线程 A 读 取 偏 移 量 为 300 的 记录 ， 而 线程 B 读 取 偶 
| 

问题 。 











12.11 小 结 


在 UNIX 系 统 中 ， 线 程 提 供 了 分 解 并 友 任 务 的 为 一 种 模型 。 线 程 促 
进 了 独立 控制 线程 之 间 的 共享 ， 但 也 出 现 了 它 特 有 的 同步 问题 。 本 章 
中 ， 我 们 了 解 了 如 何 调整 线程 和 它们 的 同步 原 语 ， 讨 论 了 线程 的 可 重 入 
性 ， 还 学 习 了 线程 如 何 与 其 他 面 问 进程 的 系统 调用 进行 交互 。 





12.1 在 Linux 系 统 中 运行 图 12-17 中 的 程序 ， 但 把 输出 结果 重 定向 到 
一 个 文件 中 ， 并 解释 结果 。 

12.2 实现 putenv_r， 即 putenv 的 可 重 入 版 本 。 确 保 你 的 实现 既是 线 
程 安全 的 ， 也 是 异步 信号 安全 的 。 

12.3 ”是 否 可 以 通过 在 getenv 函 数 开始 的 时 候 阻 窄 信 号 ， 并 在 getenv 
六 数 返回 之 前 恢复 原来 的 信号 屏蔽 字 这 种 方法 ， 让 图 12-13 中 的 getenv 函 
数 变 成 异步 信号 安全 的 ?解释 其 原因 。 

12.4 写 一 个 程序 练习 图 12-13 中 的 getenv 版 本 ， 在 FreeBSD 上 编译 并 
运行 程序 ， 会 出 现 什么 结果 ? 解释 其 原因 。 

12.5 假设 可 以 在 一 个 程序 中 创建 多 个 线程 执行 不 同 的 任务 ， 为 什么 
还 是 有 可 能 会 需要 用 fork? 解释 其 原因 。 

12.6 重新 实现 图 10-29 中 的 程序 ， 在 不 使 用 nanosleep 或 
clock_nanosleep 的 情况 下 使 它 成 为 线程 安全 的 。 

12.7 调用 fork 以 后 ， 是 否 可 以 通过 首先 用 pthread_cond_destroy 销 毁 
条 件 变量 ， 然 后 用 pthread_cond_init 初始 化 条 件 变 量 这 种 方法 安全 地 在 
子 进程 中 对 条 件 变量 进行 重新 初始 化 ? 

12.8 图 12-8 中 的 timeout 函 数 可 以 大 大 人 简 化， 解释 其 原因 。 














SE 43 EF VE 护 进程 


BIS 


守护 进程 (daemon) 是 生存 期 长 的 一 种 进程 。 它 们 常常 在 系统 引导 
装 入 时 启动 ， 仅 在 系统 关闭 时 才 终 止 。 因 为 它们 没有 控制 终端 ， 所 以 说 
它们 是 在 后 台 运 行 的 。UNIX 系 统 有 很 多 守护 进程 ， 它 们 执行 日 第 事务 
活动 。 

本 章 将 说 明 守 护 进程 结构 ， 以 及 如 何 编写 守护 进程 程序 。 因 为 守护 
a a 
错 情况 。 

有 关 守 护 进程 这 一 术语 被 应 用 于 计算 机 系统 的 历史 背景 ， 详 见 
Raymond[1996]. 


13.2 4F 
让 我 们 先 来 看 一 些 党 


4 


? Y 


种 用 的 系统 守护 进程 ， 以 及 它们 是 怎样 和 第 9 章 


中 叙述 的 进程 组 、 控 制 终端 和 会 话 这 三 个 概念 相关 联 的 。ps(1) 命 令 打印 


系统 中 各 个 进程 的 状态 。 


该 命令 有 多 个 选项 ， 


有 关 细 节 请 参考 系统 手 


册 。 为 了 解 本 节 讨 论 中 所 需 的 信息 ， 我 们 在 基于 BSD 的 系统 下 执行 


ps -axj 


选项 -a 显示 由 其 他 用 户 所 拥有 的 进程 的 状态 





，-X 显 示 没 有 控制 终端 








的 进程 状态 ，-j 显 示 与 作业 有 关 的 信息 : 会 话 ID、 进 程 组 ID、 控 制 终端 
以 及 终端 进 时 组 ID 。 在 基于 System V 的 系统 中 ， 与 此 相 类 似 的 命令 是 ps 
-efj 《为 了 提高 安全 性 ， 某 些 UNIX 系 统 不 允许 用 户 使 用 ps 命令 查看 不 属 
Fa omit HERE) ps 的 输出 大 致 是 : 

UID PID PPID PGID SID TTY COMD 

root 1 0 1 1 ? /sbin/init 

root 2 0 0 0 ?  [kthreadd] 

root 3 2 0 0 ? [ksoftirqd/0] 

root 6 2 0 0 ? [migration/0] 

root 7 2 0 0 ? [watchdog/0] 

root 21 2 0 0 ? [cpuset] 

root 22 2 0 0 ? [khelper] 

root 26 2 0 0 ? [sync_supers] 

root 27 2 0 0 ? [bdi-default] 

root 29 2 0 0 ? [kblockd| 

root 35 2 0 0 ? [kswapd0] 

root 49 2 0 0 ? [scsi eh 0] 

root 256 2 0 0 ? [jbd2/sda5-8|] 

root 26464 1 26464 26464 ? rpcbind -w 

root 14596 2 0 0 ? [fush-8:0] 

root 13047 2 0 0 ? [kworker/1:0] 

root 8196 1 8196 8196 ? /usr/sbin/sshd -D 

daemon 1068 1 1068 1068 ? atd 

root 1067 1 1067 1067 ? cron 

root 1037 1 1037 1037 ? /usr/sbin/inetd 

root 906 1 906 906 ? /usr/sbin/cupsd -F 


syslog 847 1 843 843 ? rsyslogd -c5 


root 257 2 0 0 ? [ext4-dio-unwrit] 
statd 28490 1 28490 28490 ? rpc.statd -L 
root 28561 1 28561 28561 ? rpc.idmapd 
root 28554 2 0 0 ? [nfsiod] 
root 28553 2 0 0 ? [rpciod] 
root 28775 1 28775 28775 
? /usr/sbin/rpc.mountd --manage-gids 
root 28764 2 0 0 ? [nfsd] 
root 28761 2 0 0 ? ~~ [lockd] 


其 中 ， 已 移 去 了 一 些 我 们 不 感 兴趣 的 列 ， 如 累计 CPU 时 间 。 按 照 顺 
序 ， 各 列 标题 的 意义 分 别 是 用 户 ID、 进 程 ID、 父 进程 ID、 进 程 组 ID、 
会 话 ID、 终 端 名 称 以 及 命令 字符 串 。 

此 ps 命令 在 支持 会 话 ID 的 系统 (Linux 3.2.0) 上 运行 ，9.5 节 的 setsid 
函数 中 曾 提 及 会 话 ID。 简 单 地 说 ， 它 了 驶 是 会 话 首 进程 的 进程 ID。 但 是 ， 
一 些 基于 BSD 的 系统 ， 如 Mac OS X 10.6.8， 将 打印 与 本 进程 所 属 进 程 组 
对 应 的 session 结 构 的 地 址 〈 见 9.11 节 ) ， 而 非 会 话 古 的 地 址 。 

系统 进程 依赖 于 操作 系统 实现 。 父 进程 ID 为 0 的 各 进程 通常 是 内 核 
进程 ， 它 们 作为 系统 引导 装 入 过 程 的 一 部 分 而 启动 。 (init 是 个 例外 ， 
它 是 一 个 由 内 核 在 引导 装 入 时 启动 的 用 户 层次 的 命令 。) 内 核 进程 是 特 
殊 的 ， 通 党 存在 于 系统 的 整个 生命 期 中 。 它 们 以 超级 用 户 特 权 运 行 ， 无 
控制 终端 ， 无 命令 行 。 的 服务 。rsyslogd 守 护 进 程 可 以 被 由 管理 员 启 用 
的 将 系统 消息 记 入 日 志 的 任何 程序 使 用 。 可 以 在 一 台 

rpcbind 守 护 进 程 提 供 将 远程 过 程 调 用 (Remote Procedure Call, 
RPC) 程序 号 映射 为 网 络 端口 号 

在 ps 的 输出 实例 中 ， 内 核 守 护 进 程 的 名 字 出 现在 方 括号 中 。 该 版 本 
的 _ Linux 使 用 一 个 名 为 kthreadd 的 特殊 内 核 进 程 来 创建 其 他 内 核 进 程 ， 
所 以 kthreadd 表现 为 其 他 内 核 进程 的 父 进程 。 对 于 需要 在 进程 上 下 文 执 
行 工 作 但 却 不 被 用 户 层 进程 上 下 文 调用 的 每 一 个 内 核 组 件 ， 通 常 有 它 自 
己 的 内 核 守护 进程 。 例 如 ， 在 Linux 中 : 

。 kswapd 守 护 进 程 也 称 为 内 存 换 页 守护 进程 。 它 支持 虚拟 内 存 子 系 
统 在 经 过 一 段 时 间 后 将 脏 页 面 慢 慢 地 写 回 磁盘 来 回收 这 些 页面 。 

。 flush 守 护 进程 在 可 用 内 存 达 到 设置 的 最 小 立 值 时 将 脏 页 面 冲洗 至 
人 磁 抢 。 它 也 定期 地 将 脏 页 面 冲 洗 回 磁盘 来 减少 在 系统 出 现 故 障 时 发 生 的 
数据 丢失 。 多 个 冲洗 守护 进程 可 以 同时 存在 ， 每 个 写 回 的 设备 都 有 一 个 
冲洗 守护 进程 。 输 出 实例 中 显示 出 一 个 名 为 flush-8:0 的 冲洗 守护 进程 。 
从 名 字 中 可 以 看 出 ， 写 回 设备 是 通过 主 设备 号 (8) MIKES 0) 来 



































识别 的 。 

“sync_supers 守 护 进程 定期 将 文件 系统 元 数据 冲洗 至 磁盘。 

“jbd 守 护 进 程 帮助 实现 了 ext4 文 件 系统 中 的 日 志 功 能 。 

进程 1 通常 是 init (Mac OS X 中 是 launchd) ，8.2 节 对 此 做 过 说 明 。 
它 是 一 个 系统 守护 进程 ， 除 了 其 他 工作 外 ， 主 要 负责 启动 各 运行 层次 特 
定 的 系统 服务 。 这 些 服务 通常 是 在 它们 自己 拥有 的 守护 进程 的 帮助 下 实 
现 的 。 实 际 的 控制 台 上 打印 这 些 消 息 ， 也 可 将 它们 写 到 一 个 文件 中 。 
(13.4 节 将 对 syslog 设 施 进行 说 明 。) 

9.3 节 已 谈 到 inetd 守 护 进程 。 它 侦 听 系统 网 络 接口 ， 以 便 取 得 来 自 
网 络 的 对 各 种 网 络 服务 进程 的 请 求 。nfsd、nfsiod、1lockd、rpciod、 
rpc.idmapd、rpc.statd 和 rpc.mountd 守 护 进程 提供 对 网 络 文件 系统 
(Network File System, NFS) 的 文 持 。 注 意 ， 前 4 个 是 内 核 守 护 进 程 ， 
后 3 个 是 用 户 级 守护 进程 。 

cron 守 护 进 程 在 定期 安排 的 日 期 和 时 间 执 行 命令 。 许 多 系统 管理 任 
务 是 通过 cron 每 隔 一 段 固定 的 时 间 就 运行 相关 程序 而 得 以 实现 的 。atd 守 
护 进程 与 con 类似 ， 它 允许 用 户 在 指定 的 时 间 执 行 任 务 ， 但 是 每 个 任务 
它 只 执行 一 次 ， 而 非 在 定期 安排 的 时 间 反 复 执 行 。cupsd 和 守护 进程 是 个 
打印 假 脱 机 进程 ， 它 处 理 对 系统 提出 的 各 个 打印 请 求 。sshd 守 护 进程 提 
供 了 安全 的 远程 登录 和 执行 设施 。 

注意 ， 大 多 数 守 护 进 程 都 以 超级 用 户 〈root) 特权 运行 。 所 有 的 守 
护 进程 都 没有 控制 终端 ， 其 终端 名 设置 为 问号 。 内 核 守护 进程 以 无 控制 
终端 方式 启动 。 用 户 层 守护 进程 缺少 控制 终端 可 能 是 守护 进程 调用 了 
setsid 的 结果 。 大 多 数 用 户 层 守 护 进程 都 是 进程 组 的 组 长 进程 以 及 会 话 
的 首 进程 ， 而 且 是 这 些 进程 组 和 会 话 中 的 唯一 进程 (rsyslogd 是 一 个 例 
外 ) 。 最 后 ， 应 当 引 起 注意 的 是 用 户 层 守护 进程 的 父 进 程 是 init 进 程 。 





























13 3 编 程 $i pl] 


在 编写 守护 进程 程序 时 需 遵 循 一 些 基 本 规则 ， 以 防止 产生 不 必要 的 
交互 作用 。 下 面 先 说 明 这 些 规则 ， 然 后 给 出 一 个 按照 这 些 规则 编写 的 函 
数 daemonize。 

C1) 首先 要 做 的 是 调用 umask 将 文件 模式 创建 屏蔽 字 设 置 为 一 个 已 
FE GET EO) 。 由 继承 得 来 的 文件 模式 创建 屏蔽 字 可 能 会 被 设置 为 
拒绝 某 些 权限 。 如 果 和 守护 进 程 要 创建 文件 ， 那 么 它 可 能 要 设置 特定 的 权 
限 。 例 如 ， 知 守护 进程 要 创建 组 可 读 、 组 可 写 的 文件 ， 继 承 的 文件 模式 
创建 屏蔽 字 可 能 会 屏蔽 上 述 两 种 权限 中 的 一 种 ， 而 使 其 无 法 发 挥 作用 。 
男 一 方面 ， 如 果 和 守护 进程 调用 的 库 函 数 创 建 了 文件 ， 那 么 将 文件 模式 创 
建 屏蔽 字 设 置 为 一 个 限制 性 更 强 的 值 ( 如 007) 可 能 会 更 明智 ， 因 为 库 
函数 可 能 不 允许 调用 者 通过 一 个 显 式 的 函数 参数 来 设置 权限 。 

(2) 调用 fork， 然 后 使 父 进程 exit。 这 样 做 实现 了 下 面 几 点 。 第 
一 ， 如 果 该 守护 进程 是 作为 一 条 简单 的 shell 命 令 启 动 的 ， 那 么 父 进 程 终 
止 会 让 shell 认 为 这 条 命令 已 经 执行 完毕 。 第 二 ， 虽 然 子 进程 继承 了 父 进 
程 的 进程 组 ID， 但 获得 了 一 个 新 的 进程 ID， 这 就 保证 了 子 进程 不 是 一 
个 进程 组 的 组 长 进程 。 这 是 下 面 将 要 进行 的 setsid 调 用 的 先决 条 件 。 

(3) 调用 setsid 创 建 一 个 新 会 话 。 然 后 执行 9.5 节 中 列 出 的 3 个 步 
又 ， 使 调用 进程 : (a) 成 为 新 会 话 的 首 进程 ， (b) 成 为 一 个 新 进程 组 
的 组 长 进程 ，(c) 没有 控制 终端 。 

在 基于 System V 的 系统 中 ， 有 些 人 建议 在 此 时 再 次 调用 fork， 终 止 
父 进 程 ， 继 续 使 用 子 进程 中 的 守护 进程 。 这 就 保证 了 该 守护 进程 不 是 会 
话 自 进程 ， 于 是 按照 System VAAN Chloe) 可 以 防止 它 取得 控制 终 
端 。 为 了 避免 取得 控制 终端 的 另 一 种 方法 是 ， 无 论 何 时 打开 一 个 终端 设 
备 ， 都 一 定 要 指定 O _NOCTTY。 

(4) 将 当前 工作 目录 更 改 为 根 上 目录。 从 父 进程 处 继承 过 来 的 当前 
工作 目录 可 能 在 一 个 挂 载 的 文件 系统 中 。 因 为 守护 进程 通常 在 系统 再 引 
导 之 前 是 一 直 存 在 的 ， 所 以 如 果 守 护 进 程 的 当前 工作 目录 在 一 个 挂 载 文 
FRAR, ABATE RCRD BE EE o 

或 者 ， 某 些 守 护 进程 还 可 能 会 把 当前 工作 目录 更 改 到 某 个 指定 位 
置 ， 并 在 此 位 置 进 行 它们 的 全 部 工作 。 例 如 ， 行 式 打印 机 假 脱 机 守护 进 
程 束 可 能 将 其 工作 目录 更 改 到 它们 的 spool 目 录 上 。 

(5) 关闭 不 再 需要 的 文件 描述 符 。 这 使 守护 进程 不 再 持 有 从 其 父 


























进程 继承 来 的 任何 文件 描述 得 (5 父 进 程 可 能 是 shell 进程 ， 或 某 个 其 他 
进程 ) 。 可 以 使 用 open_max 函数 (J 2.17 节 ) o (97.11 
W) 来 判定 最 高 文件 描述 符 值 ， 并 关闭 直到 该 值 的 所 有 描述 

(6) 某 些 守护 进程 打开 /dev/nill 使 其 具有 文件 描述 符 0、 ‘Lita, 这 
样 ， 任 何 一 个 试图 读 标准 输入 、 写 标准 输出 或 标准 错误 的 库 例 程 都 不 会 
产生 任何 效果 。 因 为 守护 进程 并 不 与 终端 设备 相关 联 ， 所 以 其 输出 无 处 
显示 ， 也 无 处 从 交互 式 用 户 那 里 接收 输入 。 即 使 守护 进程 是 从 交互 陈 会 
话 局 动 的 ， 但 是 守护 进程 是 在 后 台 运 行 的 ， 所 以 登录 会 话 的 终止 并 不 影 
oe 如 果 其 他 用 户 在 同一 终端 设备 上 登录 ， 我 们 不 希望 在 该 终 
aa 用 户 也 不 期 望 他 们 在 终端 上 的 输入 被 守护 进 

ie 


实例 
图 13- 1 所 示 的 函数 可 由 一 个 想 要 初始 化 为 守护 进程 的 程序 调用 。 








#include "apue ,hn 
#include <syslog.h> 
#include <fcntl.h> 
#include <sys/resource.h> 


void 
daemonize (const char *cmd) 
{ 
int 1, £00; ‘tdly Ed2; 
pid_t pid; 
struct rlimit El 
struct sigaction sa; 


/* 
* Clear file creation mask. 
*/ 


umask (0); 


/* 
* Get maximum number of file descriptors. 
*/ 
if (getrlimit (RLIMIT NOFILE, &rl) < 0) 
err quit("%s: can't get file limit", cmd); 


/* 
* Become a session leader to lose controlling TTY. 
好 

if ((pid = fork()) < 0) 

err _quit("%s: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit (0); 
setsid(); 


/* 

* Ensure future opens won't allocate controlling TTYs. 
| 

sa.sa_ handler = SIG IGN; 


sigemptyset (&Sa.sa_mask) ; 
sa.sa_flags = 0; 
if (sigaction(SIGHUP, &sa, NULL) < 0) 
err quit("%s: can't ignore SIGHUP", cmd); 
if ((pid = fork()) < 0) 
err quit("Ss: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit (0); 


/* 
* Change the current working directory to the root so 
* we won't prevent file systems from being unmounted. 
ai 
if (chdir("/") < 0) 

err_quit("%s: can't change directory to /", cmd); 


/* 
* Close all open file descriptors. 
xi 

if (rl.rlim_max == RLIM INFINITY) 

rl.rlim max = 1024; 
for (i = 0; i < rl.rlim_max; itt) 
close (i); 


/* 

* Attach file descriptors 0, 1, and 2 to /dev/null. 
2 

fd0 = open("/dev/null", O_RDWR); 


fdl = dup(0); 

fd2 = dup(0); 

/* 

* Initialize the log file. 
| 


openlog(cmd, LOG_CONS, LOG_DAEMON) ; 
if (fd0 !=0 || fdl !=1 || fd2 != 2) { 
syslog (LOG_ERR, "unexpected file descriptors %d sd sd", 
fag; fdl, £02) 
exit (1); 














图 13-1 初始 化 一 个 守护 进程 

在 daemonize 函 数 由 main 程 序 调 用 ， 然 后 main 程 序 进 入 休眠 状态 ， 
那么 可 以 用 ps 命令 检查 该 守护 进程 的 状态 : 

$ ./a.out 

$ ps -efj 

UID PID PPID PGID SID TTY CMD 

sar 13800 1 13799 13799 ? ./a.out 

$ ps -efj | grep 13799 

sar 13800 1 13799 13799 ? ./a.out 

我 们 也 可 用 ps 命令 验证 ， 没 有 活动 进程 存在 的 ID 是 13799。 这 意味 
着 ， 守 护 进 程 在 一 个 孤儿 进程 组 中 ( 见 ”9.10” 节 ) ， 它 不 是 会 话 首 进 
程 ， 因 此 没有 机 会 被 分 配 到 一 个 控制 终端 。 这 一 结果 是 在 daemonize 函 
数 中 执行 第 二 个 fork 造 成 的 。 可 以 看 出 ， 守 护 进 程 已 经 被 正确 地 初始 化 
Lie 














13.4 出 错 记 有 孙 


守护 进程 存在 的 一 个 问题 是 如 何 处 理 出 错 消息 。 因 为 它 本 就 不 应 该 
有 控制 终端 ， 所 以 不 能 只 是 简单 地 写 到 标准 错误 上 。 我 们 不 希望 所 有 守 
护 进 程 都 写 到 控制 台 设 备 上 ， 因 为 在 很 多 工作 站 上 控制 台 设 备 都 运行 着 
一 个 窗口 系统 。 我 们 也 不 希望 每 个 守护 进程 将 它 自己 的 出 错 消息 号 到 一 
个 单独 的 文件 中 。 对 任何 一 个 系统 管理 人 员 而 言 ， 如 果 要 关心 哪 一 个 守 
护 进 程 写 到 哪 一 个 记录 文件 中 ， 并 定期 地 检查 这 些 文件 ， 那 么 一 定 会 使 
他 感到 头痛 。 所 以 ， 需 要 有 一 个 集中 的 守护 进程 出 错 记录 设施 。 

BSD syslog 设施 是 在 伯克利 开发 的 ， 广 泛 应 用 于 4.2BSD。 从 BSD 
派生 的 很 多 系统 都 支持 syslog。 在 SVR4 之 前 ，System V 中 从 来 没有 一 
个 集中 的 守护 进程 记录 设施 。 在 Single UNIX Specification 的 XSI 扩 展 中 
FS T syslog K ŽL. 

自 4.2BSD 以 来 ，BSD 的 syslog 设 施 得 到 了 广泛 的 应 用 。 大 多 数 守护 
进程 都 使 用 这 一 设施 。 图 13-2 显 示 了 syslog 设 施 的 详细 组 织 结构 。 


被 写 入 文件 或 已 
登录 用 户 或 发 送 至 
另 一 个 主机 


syslogd 






/dev/log 


/dev/klog 






| 

| 

| 

| UNIX 因特网 域 数 所 
| MIRRE 报 套 接 字 
| 

| 

| 

| 

| 
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内 核 例 程 


TCP/IP 网 络 
图 13-2 BSD 的 syslog 设 施 
有 以 下 3 种 产生 日 志 消 息 的 方法 。 

(1) 内 核 例 程 可 以 调用 log 函数 。 任 何 一 个 用 户 进程 都 可 以 通过 
打开 Copen) 并 读 取 (read) /dev/klog 设 备 来 读 取 这 些 消息 。 因 为 我 们 
无 意 编写 内 核 例 程 ， 所 以 不 再 进一步 说 明 此 函数 。 

(2) 大 多 数 用 户 进 程 ( 守 护 进 程 ) 调 用 syslog(3) 函 数 来 产生 日 志 
消息 。 我 们 将 在 下 面 说 明 其 调用 序列 。 这 使 消息 被 发 送 至 UNIX 域 数据 
报 套 接 字 /dev/log。 

(3) 无 论 一 个 用 户 进 程 是 在 此 主机 上 ， 还 是 在 通过 TCP/IP 网 络 连 
接 到 此 主机 的 其 他 主机 上 ， 都 可 将 日 志 消 息 发 同 UDP 端口 514。 注 意 ， 





syslog 国 数 从 不 产生 这 些 UDP 数 据 报 ， 它 们 要 求 产生 此 日 志 消 息 的 进程 
进行 显 式 的 网 络 编程 。 

关于 UNIX 域 套 接 字 以 及 UDP 套 接 字 的 细节 ， 请 参阅 Stevens、 
Fenner 和 A 和 Rudoff[2004]。 

通常 ，syslogd 守 护 进程 读 取 所 有 3 种 格式 的 日 志 消 息 。 此 守护 进程 
在 启动 时 读 一 个 配置 文件 ， 其 文件 名 一 般 为 /etc/syslog. or 该 文件 决 
定 了 不 同 种 类 的 消息 应 送 回 何 处 。 例 如 ， 紧 急 消 息 可 发 送 至 系统 管理 员 
己 登 录 ) ， 并 在 控制 台 上 打印 ， 而 警告 消息 则 可 记录 到 一 个 文件 


该 设施 的 接口 是 syslog 函 数 。 

#include <syslog.h> 

void openlog(const char *ident, int option, int facility); 

void syslog(int priority, const char *format, ...); 

void closelog(void); 

int setlogmask(int maskpri); 

返回 值 : BUA SiC ACA rE 

调用 openlog 是 可 选择 的 。 如 果 不 调用 openlog， 则 在 第 一 次 调用 
syslog 时 ， 自 动 调 用 openlog。 调 用 ”dloselog 也 是 可 选择 的 ， 因 为 它 只 是 
关闭 兽 被 用 于 与 syslogd 守 护 进 程 进行 通信 的 描述 符 。 

调用 openlog ”使 我 们 可 以 指定 一 个 ident， 以 后 ， 此 ident 将 被 加 至 每 
则 日 志 消 息 中 。ident 一 般 是 程序 的 名 称 〈 如 cron、inetd) 。option 参 数 
是 指定 各 种 选项 的 位 屏蔽 。 图 13-3 介 绍 了 可 用 的 option 〈 选 项 ) 。 若 在 
Single UNIX Specification 的 openlogte! 中 包括 了 该 选项 ， 则 在 XSI 列 中 
用 一 个 黑 点 表示 。 


LOG_CONS BH GEERT UNIX 域 数 据 报 迭 至 sys1ogd， 则 将 该 消息 写 至 控制 台 
LOG_NDELAY 立即 打开 至 sys10gd 守护 进程 的 UNIX 域 数据 报 套 接 字 ， 不 要 等 到 第 一 条 消息 
已 经 被 记录 时 再 打开 。 通 常 ， 在 记录 第 一 条 消息 之 前 ， 不 打开 该 套 按 字 

LOG NOWAIT 不 要 等 和 在 将 消息 记 入 日 志 过 程 中 可 能 已 创建 的 子 进程 。 因 为 在 syslog 调用 


wait 时 ， 应 用 程序 可 能 已 获得 了 子 进程 的 状态 ， 这 种 处 理 阻止 了 与 捕捉 SIGCHLD 
信号 的 应 用 程序 之 间 产 生 的 冲突 


L0G_ODELAY 在 第 一 条 消息 被 记录 之 前 延迟 打开 至 syslogd 守护 进程 的 连接 

LOG_PERROR 除 将 日 志 消 息 发 送 给 syslogd 以 外 ， 还 将 它 写 至 标准 出 钳 (在 Solaris 上 不 可 用 ) 
LOG PID 记录 ry 进程 ID。 此 选项 可 供 对 每 个 不 同 的 请 求 痢 fork 一 个 子 进 
程 的 守护 进程 使 用 (与 从 不 调用 fork 的 守护 进程 相 比 较 ， 如 syslogd) 


图 13-3 openlog 的 option 参 数 

openlog 的 facility 参 数值 选取 自 图 13-4。 注 意 ，Single UNIX 
Specification 只 定义 了 facility 所 有 参数 值 中 的 一 个 子 集 ， 该 子 集 一 般 只 能 
用 在 一 个 给 定 的 平台 上 。 设 置 facility 参 数 的 目的 是 可 以 让 配置 文件 说 
明 ， 来 自 不 同 设 施 的 消息 将 以 不 同 的 方式 进行 处 理 。 如 果 不 调 用 
openlog， 或 者 以 facility 为 0 来 调用 它 ， 那 么 在 调用 syslog 时 ， 可 将 facility 
作为 priority 参 数 的 一 个 部 分 进行 说 明 。 

调用 syslog 产 生 一 个 日 志 消 息 。 其 priority 参 数 是 facility 和 level 的 组 
合 ， 它 们 可 选取 的 值 分 PAI facility ( 见 图 13-4) 和 level( 见 图 13-5) 
中 。level 值 按 优先 级 从 最 高 到 最 低 依次 排列 。 














LOG_AUDIT 
LOG_AUTH 


LOG_AUTHPRIV 


LOG_CONSOLE 
LOG_CRON 
LOG_DAEMON 
LOG_FTP 
LOG_KERN 
LOG_LOCALO 
LOG_LOCAL1 
LOG_LOCAL2 
LOG_LOCAL3 
LOG_LOCAL4 
LOG_LOCAL5 
LOG_LOCAL6 
LOG_LOCAL7 
LOG_LPR 
LOG MATL 
LOG_NEWS 
LOG_NTP 
LOG_SECURITY 
LOG_SYSLOG 
LOG_USER 
LOG_UUCP 


审计 设施 

FEY: login, su, getty 等 
与 LOG_AUTH 相同 , 但 写 日 志文 件 时 具 
有 权限 限制 

消息 写 入 /dev/console 

cron 和 at 

系统 守护 进程 ，inetd、routed 等 
FTP 守护 进程 (ftpd) 

内 核 产生 的 消息 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

保留 由 本 地 使 用 

行 式 打印 机 系统 ，lpd、lpc 等 
邮件 系统 

Usenet 网 络 新 闻 系 统 

网 络 时 间 协 议 系 统 

安全 子 系统 

syslogd 守护 进程 本 身 

来 自 其 他 用 户 进程 的 消息 (默认 ) 
UUCP 系统 





图 13-4 openlog 的 facility 参 数 


LOG EMERG 紧急 (系统 不 可 使 用 )〔( 最 高 优先 级 ) 
LOG ALERT 必须 立即 修复 的 情况 
LOG CRIT 严重 情况 (如 硬件 设备 出 错 ) 


LOG_ERR 出 错 情 况 

LOG WARNING 警告 情况 

LOG NOTICE 正常 但 重要 的 情况 
LOG_INFO 信息 性 消息 
LOG_DEBUG 调试 消息 (最 低 优 先 级 ) 





图 13-5 syslog 中 的 level 〈 按 序 排列 ) 

将 format 参 数 以 及 其 他 所 有 参数 传 至 vsprintf 函 数 以 便 进 行 格式 化 。 
在 format 中 ， 每 个 出 现 的 %m 字 符 都 先 被 代 换 成 与 errno 值 对 应 的 出 错 消 
县 字符 串 (strerror) 。 

setlogmask 函 数 用 于 设置 进程 的 记录 优先 级 屏蔽 字 。 它 返回 调用 它 
之 前 的 屏 熙 字 。 当 设置 了 记录 优先 级 屏蔽 字 时 ， 各 条 消息 除非 已 在 记录 
优先 级 屏蔽 字 中 进行 了 设置 ， 否 则 将 不 被 记录 。 注 意 ， 试 图 将 记录 优先 
级 屏蔽 字 设 置 为 0 并 不 会 有 什么 作用 。 

很 多 系统 也 将 logger(1) 程 序 作 为 同 syslog 设 施 发 送 日 志 消 恩 的 方 
法 。 虽 然 Single UNIX Specification 没有 定义 任何 可 选 参数 ， 但 某 些 实现 
允许 将 该 程序 的 可 选 参数 指定 为 facility、level 和 ident。logger 命 令 是 专 
门 为 en 的 需要 产生 日 志 消 息 的 shell 脚 本 设计 的 。 

SEB 

在 一 个 “假定 的 ) 行 式 打印 机 假 脱 机 守护 进程 中 ， 可 能 包含 有 下 面 
的 调用 序列 : 

openlog("Ipd", LOG_PID, LOG_LPR); 

syslog(LOG_ERR, "open error for %s: %m", filename); 

第 一 个 调用 将 ident 字 符 串 设置 为 程序 名 ， 指 定 该 进程 ID 要 始终 被 打 
印 ， 并 且 将 系统 默认 的 facility 设 定 为 行 式 打印 机 系统 。 对 syslog 的 调用 
指定 一 个 出 错 条 件 和 一 个 消 四 字 符 串 。 如 奉 不 调用 openlog， 则 第 二 个 
调用 的 形式 可 能 是 : 























syslog(LOG_ERR | LOG_LPR, "open error for %s: %m", filename); 

其 中 ， 将 priority 参 数 指定 为 level 和 和 facility 的 组 合 。 

除了 syslog， 很 多 平台 还 提供 它 的 一 种 变 体 来 处 理 可 变 参 数列 表 。 

#include <syslog.h> 

#include <stdarg.h> 

void vsyslog(int priority, const char *format, va_list arg); 

本 书 说 明 的 所 有 4 种 平台 都 提供 vsyslog， 但 Single UNIX 
Specification 中 并 不 包括 它 。 注 意 ， 如 果 要 使 它 的 声明 对 应 用 程序 可 
见 ， 可 能 需要 定义 一 个 额外 的 符号 ， 例 如 ， 在 FreeBSD 中 定义 
”BSD_VISIBLE 或 在 Linux 中 定义 “USE_BSD。 

大 多 数 syslog 实 现 将 使 消息 短 时 间 处 于 队列 中 。 如 果 在 此 段 时 间 中 
有 重复 消 轧 到 达 ， 那 么 syslog 守护 进程 不 会 把 它 写 到 日 志 记 录 中 ， 而 是 
会 打印 输出 一 条 类 似 于 “上 一 条 消息 重复 了 N 次 ”的 消息 。 




















13.5 里 实例 守护 进程 


为 了 正常 运作 ， 某 些 守 护 进 程 会 实现 为 ， 在 任 一 时 刻 只 运行 该 守护 
进程 的 一 个 副本 。 例 如 ， 这 种 守护 进程 可 能 需要 排 它 地 访问 一 个 设备 。 
对 cron 守 护 进 程 而 言 ， 如 果 同 时 有 多 个 实例 运行 ， 那 么 每 个 副本 都 可 能 
和 于 是 造成 该 操作 的 重复 执行 ， 这 很 可 能 导致 

Ho 

如 果 和 守护 进 程 需要 访问 一 个 设备 ， 而 该 设备 驱动 程序 有 时 会 阻止 想 
要 多 次 打开 /dev 目录 下 相应 设备 节点 的 和 尝试。 这 就 限制 了 在 一 个 时 刻 只 
能 运行 守护 进程 的 一 个 副本 。 但 是 如 果 没 有 这 种 设备 可 供 使 用 ， 那 么 我 
们 束 需 要 自行 处 理 。 

文件 和 记录 锁 机 制 为 一 种 方法 提供 了 基础 ， 该 方法 保证 一 个 守护 进 
程 只 有 一 个 副本 在 运行 。《〈 文 件 和 记录 锁 将 在 14.3 节 中 讨论 。) 如 果 每 
一 个 守护 进程 创建 一 个 有 固定 名 字 的 文件 ， 并 在 该 文件 的 整体 上 加 一 把 
写 锁 ， 那 么 只 允许 创建 一 把 这 样 的 写 锁 。 在 此 之 后 创建 写 锁 的 尝试 都 会 
失败 ， 这 回 后 续 守 护 进 程 副本 指明 已 有 一 个 副本 正在 运行 。 

文件 和 记录 锁 提 供 了 一 种 方便 的 互 斥 机 制 。 如 果 守 护 进程 在 一 个 文 
件 的 整体 上 得 到 一 把 写 锁 ， 那 么 在 该 守护 进程 终止 时 ， 这 把 锁 将 被 自动 
删除 。 这 束 简 化 了 复原 所 需 的 处 理 ， 去 除了 对 以 前 的 守护 进程 实例 需要 
进行 清理 的 有 头 操作 。 

SC 
图 13-6 所 示 的 函数 说 明了 如 何 使 用 文件 和 记录 锁 来 保证 只 运行 一 个 
守护 进程 的 一 个 副本 。 

















#include <unistd.h> 
#include <stdlib.h> 
#include <fcntl.h> 
#include <syslog.h> 
#include <string.h> 
#include <errno.h> 
#include <stdio.h> 
#include <sys/stat.h> 





#define LOCKFILE "/var/run/daemon.pid" 
#define LOCKMODE (S_IRUSR|S_IWUSR|S_IRGRP|S_ IROTH) 


extern int lockfile(int); 


int 
already_running (void) 
{ 

int fd; 

char buf [16]; 


fd = open(LOCKFILE, O_RDWR|O_CREAT, LOCKMODE) ; 
be (Ed < 0) d 
syslog (LOG_ERR, "can't open %s: %s", LOCKFILE, strerror(errno)); 
exit (1); 
} 
if (lockfile(fd) < 0) { 
if (errno == EACCES || errno == EAGAIN) { 
close (fd); 
return (1); 
} 
syslog (LOG_ERR, "can't lock %s: %s", LOCKFILE, strerror (errno) ) ; 
exit(1); 
} 
ftruncate(fd, 0); 
sprintf (buf, "ld", (long) getpid()); 
write (fd, buf, strlen (buf)+1); 
return (0); 








图 13-6 保证 只 运行 一 个 守护 进程 的 一 个 副本 

守护 进程 的 每 个 副本 都 将 试图 创建 一 个 文件 ， 并 将 其 进程 ID 写 到 
该 文件 中 。 这 使 管理 人 员 易 于 标识 该 进程 。 如 果 该 文件 已 经 加 了 锁 ， 那 
么 lockfile 函 数 将 失败 ，ermo 设 置 为 EACCES 或 EAGAIN， 图 13-6 中 的 函 
数 返 回 1， 表 明 该 守护 进程 已 在 运行 。 否 则 将 文件 长 度 截断 为 0， 将 进程 
ID 写 入 该 文件 ， 图 13-6 中 的 函数 返回 0。 

需要 将 文件 长 度 截 断 为 0， 其 原因 是 之 前 的 守护 进程 实例 的 进程 ID 
字符 串 可 能 长 于 调用 此 函数 的 当前 进程 的 进程 ID 字符 串 。 例 如 ， 若 以 前 
的 守护 进程 的 进程 ID 是 12345， 而 新 实例 的 进程 ID 是 9999， 那 么 将 此 进 
人 在 文件 中 留 下 的 是 99995。 将 文件 长 度 截 断 为 0 就 解决 

问题 。 





























13.6 STIE RSA 


在 UNIX 系 统 中 ， 和 守护 进程 遵循 下 列 通 用 惯例 。 

行 守护 进程 使 用 锁 文 件 ， 那 么 该 文件 通 各 存储 在 /varrun 目 录 中 。 
然而 需要 注意 的 是 ， 守 护 进程 可 能 需要 具有 超级 用 户 权 限 才 能 在 此 目录 
下 创建 文件 。 锁 文件 的 名 字 通 常 是 name.pid， 其 中 ，name 是 该 守护 进程 
或 服务 的 名 字 。 例 如 ，cron 守 护 进 程 锁 文件 的 名 字 是 /varrun/crond.pid。 

“ 行 守护 进程 文 持 配置 选项 ， 那 么 配置 文件 通 和 存放 在 /etc 目 录 中 。 
配置 文件 的 名 字 通 常 是 name.conf， 其 中 ，name 是 该 守护 进程 或 服务 的 
名 字 。 例 如 ，syslogd 守 护 进 程 的 配置 文件 通常 是 /etc/syslog.conf。 

守护 进程 可 用 命令 行 启动 ， 但 通常 它们 是 由 系统 初始 化 脚本 之 一 

(/etc/rc* 或 /etc/init.d/*) 启动 的 。 如 果 在 守护 进程 终止 时 ， 应 当 自 动 地 
重新 启动 它 ， 则 我 们 可 在 /etc/inittab 中 为 该 守护 进程 包括 respawn 记 录 

项 ， 这 样 ，init 束 将 重新 局 动 该 守护 进程 。《〈 假 定 系 统 使 用 System VA 
格 的 init 命 令 。) 

“各 一 个 守护 进程 有 一 个 配置 文件 ， 那 么 当 访 守护 进程 启动 时 会 读 
该 文件 ， 但 在 此 之 后 一 般 就 不 会 再 查看 它 。 知 某 个 管理 员 更 改 了 配置 文 
件 ， 那 么 该 守护 进程 可 能 需要 被 停止 ， 然 后 再 局 动 ， 以 使 配置 文件 的 更 
改 生效 。 为 避免 此 种 厂 烦 ， 某 些 守 护 进程 将 捕捉 SIGHUP 信 号 ， 当 它们 
接收 到 该 信号 时 ， 重 新 读 配置 文件 。 因 为 守护 进程 并 不 与 终端 相 结合 ， 
它们 或 者 是 无 控制 终端 的 会 话 首 进 程 ， 或 者 是 孤儿 进程 组 的 成 员 ， 所 以 
守护 进程 没有 理由 期 望 接收 SIGHUP。 于 是 ， 守 护 进程 可 以 安全 地 重复 
使 用 SIGHUP。 

实例 

图 13-7 所 示 的 程序 说 明了 守护 进程 可 以 重读 其 配置 文件 的 一 种 方 
法 。 访 程序 使 用 sigwait 以 及 多 线程 ， 对 此 我 们 已 经 在 12.8 节 讨论 过 。 























finclude "apue ,hy 
finclude <pthread.h> 
#include <syslog.h> 


sigset_t mask; 


extern int already running (void); 


void 
reread (void) 
| 
J sey, HY 
void * 


thr_fn(void *arg) 
| 


int err, signo; 


for (ii) | 
err = sigwait(émask, &signo); 
if (err != 0) { 


syslog (LOG_ERR, "sigwait failed"); 
exit (1); 


switch (signo) { 
case SIGHUP: 
syslog (LOG_INFO, 
reread(); 
break; 


case SIGTERM: 
syslog (LOG_INFO, 


exit (0); 


default: 
syslog (LOG_INFO, 


} 


return (0); 


(int arge, «haz *argyv'L.].) 


int err; 
pthread_t tid; 
char * cmd; 


struct sigaction sa; 


"Re-reading configuration file"); 


"got SIGTERM; exiting"); 


"unexpected signal %d\n", signo); 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 

else 
cmd++; 

px 

* Become a daemon. 

RT 


daemonize (cmd) ; 


px 


* Make sure only one copy of the daemon is running. 


ay 
if (already _running()) { 


syslog(LOG_ERR, “daemon already running"); 


exit (1); 


/* 


* Restore SIGHUP default and block all signals. 


区 

sa.sa_handler = SIG _DFL; 
sigemptyset (&sa.sa_mask) ; 
sa.sa_flags = 0; 


if (sigaction(SIGHUP, &sa, NULL) < 0) 
err _quit("%s: can't restore SIGHUP default"); 


sigfillset (&mask) ; 


if ((err = pthread sigmask (SIG BLOCK, &mask, NULL)) != 0) 
err exit (err; "SIG BLOCK error"); 


/* 
* Create a thread to handle SIGHUP and SIGTERM. 


| 
err = pthread create({tid, NULL, thr fn, 0); 
if (err != 0) 


err exit(err, "can't create thread"); 


/+ 
* proceed with the rest of the daemon, 


*/ 





图 13-7 守护 进程 重读 配置 文件 
该 程序 调用 了 图 13-1 中 的 daemonize 来 初始 化 守护 进程 。 从 该 函数 返 
回 后 ， 调 用 图 13-6 中 的 already_running 函 数 以 确保 该 守护 进程 只 有 一 个 
副本 在 运行 。 到 达 这 一 点 时 ，SIGHUP 信 和 号 仍 被 忽略 ， 所 以 需 恢 复 对 该 
言 号 的 系统 默认 处 理 方式 ;否则 调用 sigwait 的 线程 决 不 会 见 到 该 信号 。 
如 同 对 多 线程 程序 所 推荐 的 那样 ， 阻 塞 所 有 信和 号， 然后 创建 一 个 线 
程 处 理 信 号 。 该 线程 的 唯一 工作 是 等 待 SIGHUP 和 SIGTERM。 当 接收 到 
SIGHUP IZ € ae 该 线程 调用 reread 函 数 重读 它 的 配置 文件 。 当 它 接收 到 
SIGTERM 信 号 时 ， 会 记录 消息 并 退出 。 
回顾 图 10-1，SIGHUP 和 SIGTERM 的 默认 动作 是 终止 进程 。 因 为 我 
们 阻塞 了 这 些 信和 号， 所 以 当 SIGHUP 和 SIGTERM 的 其 中 一 个 被 发 送 到 守 
护 进 程 时 ， 守 护 进程 不 会 消亡 。 作 为 蔡 代 ， 调 用 sigwait 的 线程 在 返回 时 
E ae 
SE Api 
并 非 所 有 守护 进程 都 是 多 线程 的 。 图 13-8 中 的 程序 说 明 一 个 单线 
程 守护 进程 如 何 捕捉 SIGHUP 并 重读 其 配置 文件 。 














finclude "apue ,ha 
finclude <syslog.h> 
finclude <errno.h> 


extern int lockfile(int) ; 
extern int already running (void); 


void 
reread (void) 
| 
/+ see */ 
} 
vold 


sigterm(int signo) 

| 
syslog (LOG_INFO, "got SIGTERM; exiting"); 
exit (0); 


void 


sighup(int signo) 


{ 


syslog(LOG_INFO, "Re-reading configuration file"); 


reread (); 


(int argc, char *argv[]) 


char xema; 
struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 

else 
cmd++; 

/* 

* Become a daemon. 

af, 


daemonize (cmd) ; 


/* 

* Make sure only one copy of the daemon is running. 

i 

if (already_running()) { 
syslog(LOG_ERR, “daemon already running"); 
exit. (2) + 

} 

/* 

* Handle signals of interest. 

+7 

sa.sa_handler = sigterm; 


sigemptyset (&Sa.sa_mask); 

sigaddset (&sa.sa_mask, SIGHUP); 

sa.sa_flags = 0; 

if (sigaction(SIGTERM, &sa, NULL) < 0) { 
syslog (LOG_ERR, "can't catch SIGTERM: %s", 
exit(1); 

} 

sa.sa_handler = sighup; 

sigemptyset (&sa.sa_mask); 

sigaddset (&sa.sa_mask, SIGTERM) ; 

sa.sa_flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) < 0) A 
syslog(LOG_ERR, “can't catch SIGHUP: %s", 
exit(1); 


/* 

* Proceed with the rest of the daemon. 
Wy 

SR ey Ey 


strerror(errno) ); 


strerror(errno) ); 


exit (0); 


图 13-8 守护 进程 重读 配置 文件 的 另 一 种 实现 

在 初始 化 守护 进程 后 ， 我 们 为 SIGHUP 和 SIGTERM 配 置 了 信和 号 处 理 
程序 。 可 以 将 重读 逻辑 放 在 信号 处 理 程序 中 ， 也 可 以 只 在 信号 处 理 程 序 
中 设置 一 个 标志 ， 并 由 守护 进程 的 主线 程 完成 所 有 的 工作 。 








13.7 客户 进程 -服务 发 进程 模型 


守护 进程 常常 用 作 服 务 器 进程 。 确 实 ， 我 们 可 以 称 图 13-2 中 的 
syslogd 进 程 为 服务 嚣 进程， 用户 进 程 (客户 进程 》 用 UNIX 域 数据 报 套 
接 字 回 其 发 送 消息 。 

一 般 而 言 ， 服 务 器 进程 等 待 客户 进程 与 其 联系 ， 提 出 某 种 类 型 的 服 
FBR. Al 13-2 中 ， 由 syslogd 服 务 器 进程 提供 的 服务 是 将 一 条 出 错 消 
奶 记 录 到 日 志文 件 中 。 

图 13-2 中 ， 客 户 进 程 和 服务 占 进 程 之 间 的 通信 和 是 单 同 的 。 客 户 进程 
同 服 务 器 进程 发 送 服务 请 求 ， 服 务 占 进程 则 不 回 客 户 进 程 回 送 任何 消 
恩 。 在 下 和 面 有 关 进 程 通信 的 几 章 中， 我 们 将 见 到 大 量 客户 进程 和 服务 器 
进程 之 间 双 同 通 信 的 实例 。 客 户 进 程 回 服务 器 进程 发 送 请 求 ， 服 务 嚣 进 
程 则 同 客 户 进 程 回 送 应 答 。 

在 服务 器 进程 中 调用 fork 然 后 exec 另 一 个 程序 来 向 客户 进程 提供 服 
务 是 很 常见 的 。 这 些 服 务 嚣 进程 通常 管理 着 多 个 文件 揪 述 符 ， 通 信 绒 
点 、 配 置 文 件 、 日 志文 件 和 类 似 的 文件 。 最 好 的 情况 下 ， 让 子 进程 中 的 
这 些 文件 摘 述 符 保持 打开 状态 并 无 大 碍 ， 因 为 它们 很 可 能 不 会 被 在 子 进 
程 中 执行 的 程序 所 使 用 ， 尤 其 是 那些 与 服务 器 端 无 关 的 程序 。 最 坏 情 况 
下 ， 保 持 它 们 的 打开 状态 会 导致 安全 问题 一 一 被 执行 的 程序 可 能 有 一 些 
恶意 行为 ， 如 更 改 服务 器 端 配 置 文件 或 欺骗 客户 端 程 序 使 其 认为 正在 与 
服务 器 端 通信 ， 从 而 获取 未 授权 的 信息 。 

解雇 此 问题 的 一 个 简单 方法 是 对 所 有 被 执行 程序 不 需要 的 文件 描述 
符 设置 执行 时 关闭 Cclose-on-exec) 标志 。 图 13-9 展 示 了 一 个 可 以 用 来 
在 服务 器 端 进程 中 执行 上 述 工 作 的 函数 。 


























finclude "apue hn 
tinclude <fcntl.h> 


int 
set_cloexec(int fd) 
| 


int val; 


if ((val = fentl(fd, F GETFD, 0)) < 0) 
return(-1); 


val |= FD CLOEXEC; /* enable close-on-exec */ 


return (fentl (fd, F SETFD, val)); 


图 13-9 设置 执行 时 关闭 标志 


13.8 小 结 


在 大 多 数 UNIX 系 统 中 ， 守 护 进程 是 一 直 运 行 的 。 为 了 初始 化 我 们 
目 己 的 进程 ， 使 之 作为 守护 进程 运行 ， 需 要 一 些 审慎 的 思索 并 理解 第 9 
章 中 说 明 的 进程 之 间 的 关系 。 本 章 开发 了 一 个 可 由 守护 进程 调用 的 能 对 
其 上 自身 正确 初始 化 的 函数 。 

因为 守护 进程 通常 没有 控制 终端 ， 所 以 本 半 还 讨论 了 守护 进程 记录 
出 错 消 息 的 几 种 方法 。 我 们 讨论 了 在 大 多 数 UNIX 系 统 中 ， 和 守护 进程 草 
循 的 右 干 惯例 ， 给 出 了 几 个 如 何 实现 某 些 惯例 的 实例 。 





习题 


13.1 从 图 13-2 可 以 推测 出 ， 直 接 调 用 openlog 或 第 一 次 调用 syslog 都 
可 以 初始 化 syslog 设 施 ， 此 时 一 定 要 打开 用 于 UNIX 域 数据 报 套 接 字 的 
特殊 设备 文件 /dewlog。 如 果 调 用 openlog 前 ， 用 户 进程 〈 守 护 进程 ) 先 
调用 了 chroot， 结 果 会 怎么 样 ? 

13.2 回顾 13.2 节 中 ps 输出 的 示例 。 唯 一 一 个 不 是 会 话 首 进程 的 用 户 
层 守护 进程 是 rsyslogd 进 程 。 请 解释 为 什么 rsyslogd 守 护 进 程 不 是 会 话 首 


TERE 
13.3 列 出 你 系统 中 所 有 有 效 的 守护 进程 ， 并 说 明 它 们 各 目的 功能 。 
13.4 编写 一 段 程 序 调用 图 13-1 中 daemonize 函 数 。 调 用 该 函数 后 ， 它 
已 成 为 守护 进程 ， 再 调用 getlogin 〈 见 8.15 节 ) 查看 该 进程 是 否 有 登录 
名 。 将 结果 打印 到 一 个 文件 中 。 




















14.1 引言 


本 章 涵 善 众 多 概念 和 函数 ， 我 们 把 它们 统统 都 放 到 高 级 VO 下 讨 
W: JEMENO, WRH VO 多 路 转 接 〈select 和 poll KZO ~ FH 
I/O, readv 和 writev 函数 以 及 存储 映射 UO (mmap) 。 第 15 章 和 第 17 章 
ee 以 及 以 后 各 章 中 的 很 多 实例 都 要 使 用 本 章 所 描述 的 概念 
和 函数 。 








14.2 3£V/O 


10.5 节 中 曾 将 系统 调用 分 成 两 类 : “低速 ”系统 调用 和 其 他 。 低 速 系 
统 调用 是 可 能 会 使 进程 永远 阻塞 的 一 类 系统 调用 ， 包 括 : 

“如 果 某 些 文件 类 型 (如 读 管 道 、 终端 设备 和 网 络 设备 ) 的 数据 并 
不 存在 ， 读 操作 可 能 会 使 调用 者 永远 阻塞 ; 

如 果 数 据 不 能 被 相同 的 文件 类 型 立即 接受 〈 如 管道 中 无 空间 、 网 
络 流 控制 ) ， 写 操作 可 能 会 使 调用 者 永远 阻塞 ; 

“在 茶 种 条 件 发 生 之 前 打开 茶 些 文件 类 型 可 能 会 发 生 阻塞 (如 要 打 
开 一 个 终端 设备 ， 需 要 先 等 待 与 之 连接 的 调制 解 调 器 应 答 ， 又 如 若 以 只 
与 借 民 打开 FIFO， 那 委 在 没有 其 低 进程 也 用 读 模式 打开 该 FIFO 时 也 要 
等 待 ) ; 

对 已 经 加 上 强制 性 记录 锁 的 文件 进行 读 写 ; 

。 某 些 ioctl 操 作 ， 

。 某 些 进程 间 通 信函 数 〈 见 第 15 章 ) 。 

我 们 也 曾 说 过 ， 虽 然 读 写 磁盘 文件 会 暂时 阻塞 调用 者 ， 但 并 不 能 将 
与 磁盘 LO 有 关 的 系统 调用 视 为 “低速 ”。 

非 阻塞 IO 使 我 们 可 以 发 出 open、read 和 write 这 样 的 IO 操作 ， 并 使 

这 些 操 作 不 会 永远 阻塞 。 如 果 这 种 操作 不 能 完成 ， 则 调用 立即 出 错 返 
回 ， 表示 该 操作 如 继 乡 RAITHE. 

对 于 一 个 给 定 的 描述 符 ， 有 了 两 种 为 其 指 定 非 阻塞 O 的 方法 。 

(1) Ini SR IR openi AHR 符 ， 则 可 指定 O_NONBLOCK 标 志 
( 见 3.3 节 ) 。 

(2) 对 于 已 经 打开 的 一 个 描述 符 ， 则 可 调用 fcntl， 由 该 函数 打开 
O_NONBLOCK 文件 状态 标志 〈 见 3.14 节 ) 。 图 3-12 中 的 函数 可 用 来 为 
一 个 描述 符 打 开 任 一 文件 状态 标志 。 

System V 的 早期 版 本 使 用 标志 O_NDELAY 指 定 非 阻塞 方式 。 在 这 
些 System V 版 本 中 ， 如 果 无 数据 可 读 ， 则 read 返 回 0。 而 UNIX 系 统 又 名 
将 read 的 返回 值 0 解释 为 文件 结束 ， 两 者 有 所 混 消 。POSIX.1 提 供 了 一 个 
非 阻塞 标志 ， 它 的 名 字 和 语义 都 与 O NDELAY 不 同 。 确 实 ， 在 System 
V 的 早期 版 本 中 ， 当 从 read 得 到 返回 值 0 时 ， 我 们 并 不 知道 该 调用 是 阻塞 
了 还 是 过 到 了 文件 尾 端 。POSIX.1 要 求 ， 对 于 一 个 非 阻 塞 的 描述 符 如 果 
无 数据 可 读 ， 则 read 返 回 -1，errno 被 设置 为 EAGAIN。System V 派 生 的 
某 些 平台 既 支 持 较 旧 的 O_NDELAY， 又 支持 POSIX.1 的 











O_NONBLOCK， 但 在 本 书 的 实例 中 只 使 用 POSIX.1 规 定 的 特征 。 较 旧 
的 O_NDELAY 只 是 为 了 同 后 兼容 ， 不 应 在 新 应 用 程序 中 使 用 。 

4.3BSD 为 fcntl 提 供 了 FNDELAY 标 志 ， 其 语义 也 稍 有 区 别 。 它 不 只 
影响 描述 符 的 文件 状态 标志 ， 还 将 终端 设备 或 套 接 字 的 标志 更 改 成 非 阻 
塞 的 ， 因 此 不 仅 影 啊 共 享 同 一 文件 表 项 的 用 户 ， 而 且 对 终端 或 套 接 字 的 
所 有 用 户 起 作用 (4.3BSD 非 阻 塞 VO 只 对 终端 和 套 接 字 起 作用 ) 。 另 
外 ， 如 果 对 一 个 非 阻塞 摘 述 符 的 操作 不 能 无 阻塞 地 完成 ， 那 么 4.3BSD 返 
回 EWOULDBLOCK。 现 今 ， 基 于 BSD 的 系统 提供 POSIX.1 的 
O_NONBLOCK 标 志 ， 并 且 将 EWOULDBLOCK 定 义 为 与 PCOSIX.1 的 
EAGAIN 相 同 。 这 些 系统 提供 与 其 他 POSIX 兼 容 系统 相 一 致 的 非 阻 塞 语 
X: 文件 状态 标志 的 更 改 影响 同一 文件 表 项 的 所 有 用 户 ， 但 与 通过 其 他 
= a a 

SEA 

图 14-1 中 的 程序 是 一 个 非 阻塞 WO 的 实例 ， 它 从 标准 输入 读 500 000 
字 节 ， 并 试图 将 它们 写 到 标准 输出 上 。 该 程序 先 将 标准 输出 设置 为 非 阻 
窄 的 ， 然 后 用 for 循 环 进行 输出 ， 每 次 write 调 用 的 结果 都 在 标准 错误 上 
打印 。 函 数 clr fl 类 似 于 图 3-12 中 的 set_f1。 这 个 新 函数 清除 1 个 或 多 个 标 


志 位 。 











#include "apue ,hn 
include <errno.h> 
finclude <fentl.h> 


char — buf [500000]; 


int 

main (void) 

| 
int ntowrite, nwrite; 
char  *ptr; 


ntowrite = read(STDIN FILENO, buf, sizeof (buf)); 
fprintf(stderr, "read $d bytes\n", ntowrite) ; 


set_fl(STDOUT_FILENO, O_NONBLOCK); /* set nonblocking */ 


ptr = buf; 

while (ntowrite > 0) { 
errno = 0; 
nwrite = write(STDOUT FILENO, ptr, ntowrite); 
fprintf(stderr, "nwrite = $d, errno = $d\n", nwrite, errno); 


if (nwrite > 0) { 
ptr += nwrite; 
ntowrite -= nwrite; 


clr fl (STDOUT FILENO, O NONBLOCK); /* clear nonblocking */ 


exit (0); 














图 14-1 长 的 非 阻 塞 write 
知 标准 输出 是 普通 文件 ， 则 可 以 期 望 write 只 执行 一 次 。 








$ ls -l /etc/services 打印 文件 长 度 
-rw-r--r-- 1 root 677959 Jun 23 2009 /etc/services 

$ ./a.out < /etc/services > temp.file 先 试 一 个 普通 文件 

read 500000 bytes 

nwrite = 500000, errno = 0 ee Ce 

$ ls -l temp.file 检验 输出 文件 长 度 
-TW-rW-r-- 1 sar 500000 Apr 1 13:03 temp.file 


但 是 ， 大 标准 输出 是 终端 ， 则 期 望 write 有 时 返回 小 于 500 ”000 的 一 
个 数字 ， 有 时 返回 错误 。 下 面 是 运行 结果 : 





$ ./a.out < /etc/services 2>stderr.out 终端 至 输出 
大 量 输出 至 终端 ...... 


$ cat stderr.out 

read 500000 bytes 
nwrite = 999, errno = 0 
nwrite = -1, errno = 35 
nwrite = -1, errno = 35 
nwrite = -1, errno = 35 
nwrite = -1, errno = 35 
nwrite = 1001, errno = 0 
nwrite = -1, errno = 35 
nwrite = 1002, errno = 0 
nwrite = 1004, errno = 0 
nwrite = 1003, errno = 0 
nwrite = 1003, errno = 0 
nwrite = 1005, errno = 0 
nwrite = -1, errno = 35 61 个 此 类 错误 


nwrite = 1006, errno = 0 
nwrite = 1004, errno = 0 
nwrite = 1005, errno = 0 
nwrite = 1006, errno = 0 
nwrite = -1, errno = 35 108 个 此 类 错误 


nwrite = 1006, errno = 0 

nwrite = 1005, errno = 0 

nwrite = 1005, errno = 0 

nwrite = -1, ermo = 35 681 个 此 类 错误 

nwrite = 347, errno = 0 

在 该 系统 上 ，errno 值 35 对 应 的 是 EAGAIN。 终 端 驱动 程序 一 次 能 
接受 的 数据 量 随 系统 而 变 。 具 体 结 果 还 会 因 登 录 系 统 时 所 使 用 的 方式 的 
不 同 而 不 同 : 在 系统 控制 台 上 登录 、 在 便 接 线 的 终端 上 登录 或 用 伪 终 端 
在 网 络 连接 上 登录 。 如 果 你 在 终端 上 运行 一 个 窗口 系统 ， 那 么 也 是 经 由 
伪 终 端 设 备 与 系统 交互 。 

在 此 实例 中 ， 程 序 发 出 了 9 000 多 个 write 调用 ， 但 是 只 有 500 个 真正 
输出 了 数据 ， 其 余 的 都 只 返回 了 错误 。 这 种 形式 的 循环 称 为 轮 询 ， 在 多 
用 户 系 统 上 用 它 会 浪费 CPU 时 间 。14.4 节 将 介绍 非 阻塞 描述 符 的 IO 多 路 
转 接 ， 这 是 进行 这 种 操作 的 一 种 比较 有 效 的 方法 。 

有 时 ， 可 以 将 应 用 程序 设计 成 使 用 多 线程 的 〈 见 第 11 章 ) ， 从 而 避 
免 使 用 非 阻 塞 O。 如 知 我 们 能 在 其 他 线程 中 继续 进行 ， 则 可 以 允许 单 
个 线程 在 IO 调用 中 阻塞 。 这 种 方法 有 时 能 简化 应 用 程序 的 设计 《〈 见 第 
21 章 ) ， 但 是 ， 线 程 间 同 步 的 开销 有 时 却 可 能 增加 复杂 性 ， 于 是 导致 得 
不 偿 失 的 后 果 。 





14.3 1C K 


当 两 个 人 同时 编辑 一 个 文件 时 ， 其 后 果 将 如 何 呢 ? 在 大 多 数 UNIX 
系统 中 ， 该 文件 的 最 后 状态 取决 于 写 该 文件 的 最 后 一 个 进程 。 但 是 对 于 
有 些 应 用 程序 ， 如 数据 库 ， 进 程 有 时 需要 确保 它 正 在 单独 写 一 个 文件 。 
为 了 向 进程 提供 这 种 功能 ， 商 用 UNIX 系 统 提 供 了 记录 锁 机 制 。 (第 20 
章 包 含 了 使 用 记录 锁 的 数据 库 函 数 库 。) 

记录 锁 (record locking) 的 功能 是 : 当 第 一 个 进程 正在 读 或 修改 文 
件 的 某 个 部 分 时 ， 使 用 记录 锁 可 以 阻止 其 他 进程 修改 同一 文件 区 。 对 于 
UNIX 系统 而 言 , “记录 ”这 个 词 是 一 种 误 用 ， 因 为 UNIX 系统 内 核 根 本 
没有 使 用 文件 记录 这 种 概念 。 一 个 更 适合 的 术语 可 能 是 字 节 范围 锁 
(byte-range locking) ， 因 为 它 锁定 的 只 是 文件 中 的 一 个 区 域 (也 可 能 
是 整个 文件 ) 。 

te ME 

对 早期 UNIX 系 统 的 其 中 一 个 批评 是 它们 不 能 用 来 运行 数据 库 系 
统 ， 其 原因 是 这 些 系 统 不 支持 对 部 分 文件 加 锁 。 在 UNIX 系 统 寻 找 进 入 
商用 计算 环境 的 途径 时 ， 很 多 系统 开发 小 组 以 各 种 不 同方 式 增加 了 对 记 
录 锁 的 支持 。 

早期 的 伯克利 版 本 只 支持 flock 函 数 。 该 函数 只 能 对 整个 文件 加 锁 ， 
不 能 对 文件 中 的 一 部 分 加 锁 。 

SVR3 通 过 fentl 函 数 增加 了 记录 锁 功 能 。 在 此 基础 上 构造 了 lockf 函 
数 ， 它 提供 了 一 个 简化 的 接口 。 这 些 函 数 允 许 调用 者 对 一 个 文件 中 任意 
字 节 数 的 区 域 加 锁 ， 长 至 整个 文件 ， 短 至 文件 中 的 一 个 字 节 。 

POSIX.1 标 准 的 基础 是 fcnt 方 法 。 图 14-2 列 出 了 各 种 系统 提供 的 不 
同形 式 的 记录 锁 。 注 意 ，Single UNIX Specification 在 其 XSI 扩 展 中 包括 
T lockf. 
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图 14-2 各 种 UNIX 系 统 支 持 的 记录 锁 形 式 

本 节 最 后 部 分 将 说 明 建 议 性 锁 和 强制 性 锁 之 间 的 区 别 。 本 书 只 介绍 
POSIX.1 的 fcntl 锁 。 

记录 锁 是 1980 年 由 John Bass 最 早 添加 到 V7 上 的 。 内 核 中 相应 的 
系统 调用 入 口 项 是 名 为 locking 的 函数 。 此 函数 提供 了 强制 性 记录 锁 功 
能 ， 它 被 用 在 很 多 System II 版 本 中 。Xenix 系 统 采用 了 此 函数 ， 某 些 基 
于 Intel 的 System V 派 生 版 本 ， 如 OpenServer 5， 在 Xenix 兼 容 库 中 仍旧 文 
持 该 函数 。 

2. fentlid ae it 
_ Slat Baber itt T fente 函数 的 原型 ， 为 了 叙说 方便 ， 这 里 再 重复 
= A 

#include <fcnt1.h> 

int fcnt1 (int fd, int cmd, .../* struct flock *flockptr */); 

返回 值 : 若 成 功 ， 依 赖 于 cmd(〈 见 下 ) ， 和 否则 ， 返 回 -1 

对 于 记录 锁 ， cmd 是 F_GETLK、 F_SETLK 或 F_SETLKW。 和 第 三 个 
参数 〈 我 们 将 调用 flockptr) 是 一 个 指向 flock 结 构 的 指针 。 

struct flock { 
short |_ type; /* F RDLCK, F_WRLCK, or F_UNLCK */ 
short l whence; /* SEEK SET, SEEK CUR, or SEEK END 





党 / 
off_t l_ start; /* offset in bytes, relative to |_whence */ 
off tl len; /* length, in bytes; 0 means lock to EOF */ 
pid_t l_pid; /* returned with F_GETLK */ 


}; 

对 flock 结 构 说 明 如 下 。 

所 希望 的 锁 类 型 : F_RDLCK (共享 读 锁 ) 、F_WRLCK (独占 性 
写 锁 ) 或 F_UNLCK (解锁 一 个 区 域 ) 。 


。 要 加 锁 或 解锁 区 域 的 起 始 字 节 偏 移 量 〈]_ start 和 1]_ whence) 。 

“区 域 的 字 节 长 度 Alen) 。 

.进程 的 ID (pid) 持 有 的 锁 能 阻塞 当前 进程 〈 仅 由 F_GETLK 返 
回 ) 。 

关于 加 锁 或 解锁 区 域 的 说 明 还 要 注意 下 列 几 项 规则 。 

指定 区 域 起 始 偏 移 量 的 两 个 元 素 与 lseek 函 数 〈 见 3.6 节 ) 中 最 后 两 
个 参数 类 似 。]_whence 可 选用 的 值 是 SEEK_SET、SEEK_CUR 或 
SEEK_END. 

oft AY VA CE 4 Bi CE E tit ACh FB ea ee ig A, (EAE AN BE TE 
文件 起 始 位 置 之 前 开始 。 

如 知 ]_len 为 0， 则 表示 锁 的 范围 可 以 扩展 到 最 大 可 能 偏 移 量 。 这 意 
味 痢 不 管 问 该 文件 中 退 加 写 了 多 少数 据 ， 它 们 都 可 以 处 于 锁 的 范围 内 
(不 必 猜 测 会 有 多 少 字 节 被 妃 加 写 到 了 文件 之 后 ) ， 而 且 起 始 位 置 可 以 
是 文件 中 的 任意 一 个 位 置 。 

为 了 对 整个 文件 加 锁 ， 我 们 设置 1 start 和 1]_whence 指 向 文件 的 起 始 
位 置 ， 并 且 指 定 长 度 Alen) X0. (有 多 种 方法 可 以 指定 文件 起 始 
处 ， 但 常用 的 方法 是 将 ]_start 指 定 为 0，1_whence 指 定 为 SEEK_SET。) 

上 面 提 到 了 两 种 类 型 的 锁 : 共享 读 锁 〈] type 为 L_RDLCK ) 和 独占 
性 写 锁 (L_WRLCK) 。 基 本 规则 是 : 任意 多 个 进程 在 一 个 给 定 的 季节 
上 可 以 有 一 把 共 k 享 的 读 锁 ， (AE PSA ESTER 能 一 个 进程 有 一 
把 独占 写 锁 。 进 一 步 而 言 ， 如 果 在 一 个 给 定 字 节 上 已 经 有 一 把 或 多 把 读 
锁 ， 则 不 能 在 该 字 节 上 再 加 写 锁 ;如 果 在 一 个 字 节 上 已 经 有 一 把 独占 性 












































写 锁 ， 则 不 能 再 对 它 加 任何 读 锁 。 在 图 14-3 中 示 出 了 这 些 兼 容 性 规则 。 
请 求 


当前 区 域 








图 14-3 不 同类 型 锁 彼 此 之 间 的 兼容 性 
上 面 说 明 的 兼容 性 规则 适用 于 不 同 进程 提出 的 锁 请 求 ， 并 不 适用 于 





单个 进程 提出 的 多 个 锁 请 求 。 如 果 一 个 进程 对 一 个 文件 区 间 已 经 有 了 一 
把 锁 ， 后 来 该 进程 又 企图 在 同一 文件 区 间 再 加 一 把 锁 ， 那 么 新 锁 将 葵 换 
已 有 锁 。 因 此 ， 阁 一 进程 在 某 文件 的 16 一 32 ”人 字 节 区 间 有 一 把 写 锁 ， 然 
后 又 试图 在 16 一 32 字 节 区 间 加 一 把 读 锁 ， 那 么 该 请 求 将 成 功 执行 ， 原 
FR) E BAS BS RAN TE 

加 读 锁 时 ， 该 描述 符 必 须 是 该 打开 。 加 写 锁 时 ， 该 描述 符 必 须 是 写 


下 面 说 明 一 下 fcntl 函 数 的 3 种 命令 。 

F_GETLK 判断 由 flockptr 所 摘 述 的 锁 是 否 会 被 另外 一 把 锁 所 排斥 
(BASE) 。 如 果 存 在 一 把 锁 ， 它 阻止 创建 由 flockptr 所 描述 的 锁 ， 则 该 现 
有 人 锁 的 信息 将 重 写 flockptr 指 向 的 信息 。 如 果 不 存在 这 种 情况 ， 则 除了 将 
人 站 ”flockptr 所 指 同 结构 中 的 其 他 信息 保持 不 


F_SETLK 设置 由 flockptr 所 描述 的 锁 。 如 果 我 们 试图 获得 一 把 读 锁 
(d type 为 F_RDLCK) 或 写 锁 C_typeNF_WRLCK) ， 而 兼容 性 规则 
阻止 系统 给 我 们 这 把 锁 ， 那 么 fcnt 会 立即 出 错 返 回 ， 此 时 errno 设 置 为 
EACCES 或 EAGAIN。 

虽然 POSIX.1 人 允许 实现 返回 这 两 种 出 错 代 码 中 的 任何 一 种 ， 但 本 书 
说 明 的 4 种 实现 在 锁 请 求 不 能 得 到 满足 时 ， 都 返回 EAGAIN。 

此 命令 也 用 来 清除 由 flockptr 指 定 的 锁 (]_type 为 F_UNLCK) 。 

F_ SETLKW 这 个 命令 是 F_SETLK 的 阻塞 版 本 (命令 名 中 的 W 表 示 
等 待 Cwait) ) 。 如 果 所 请 求 的 读 锁 或 写 锁 因 另 一 个 进程 当前 已 经 对 所 
请 求 区 域 的 某 部 分 进行 了 加 锁 而 不 能 被 授予 ， 那 么 调用 进程 会 被 置 为 休 
Be nee ee dP A ance ce 
星 。 

应 当 了 解 ， 用 F_GETLK 测 试 能 否 建立 一 把 锁 ， 然 后 用 FE_SETLK 或 
F_SETLKW 企 图 建立 那 把 锁 ， 这 两 者 不 是 一 个 原子 操作 。 因 此 不 能 保证 
在 这 两 次 fcntl 调 用 之 间 不 会 有 另 一 个 进程 插入 并 建立 一 把 相同 的 锁 。 如 
果 不 希 望 在 等 待 锁 变 为 可 用 时 产生 阻塞， 就 必须 处 理由 F_SETLK 返 回 的 
可 能 的 出 错 。 

注意 ，POSIX.1 并 没有 说 明 在 下 列 情 况 下 将 发 生 什 么 : 一 个 进程 在 
某 个 文件 的 一 个 区 间 上 设置 了 一 把 读 锁 ， 第 二 个 进程 在 试图 对 同一 文件 
区 间 加 一 把 写 锁 时 阻塞 ， 然 后 第 三 个 进程 则 试图 在 同一 文件 区 间 上 得 到 
男 一 把 读 锁 。 如 果 第 三 个 进程 只 是 因为 读 区 间 已 有 一 把 读 锁 ， 而 被 允许 
在 该 区 则 放置 男 一 把 读 锁 ， 那 么 这 种 实现 就 可 能 会 使 希望 加 写 锁 的 进程 
饿 死 。 因 此 ， 当 对 同一 区 间 加 男 一 把 读 锁 的 请 求 到 达 时 ， 提 出 加 写 锁 而 
阻塞 的 进程 需 等 待 的 时 间 延 长 了 。 如 果 加 读 锁 的 请 求 来 得 很 频繁 ， 使 得 
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该 文件 区 间 始 终 存 在 一 把 或 几 把 读 锁 ， 那 么 欲 加 写 锁 的 进程 就 将 等 竺 很 
长 时 间 。 

在 设置 或 释放 文件 上 的 一 把 锁 时 ， 系 统 按 要 求 组 合 或 分 裂 相 邻 区 。 
例如 ， 若 第 100~199 字 节 是 加 锁 的 区 ， 需 解锁 第 150 FT, MARK 
维持 两 把 锁 ， 一 把 用 于 第 100 一 149 字 节 ， 另 一 把 用 于 第 151 一 199 字 
节 。 图 14-4 说 明了 这 种 情况 下 的 字 节 范围 锁 。 
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图 14-4 文件 字 节 范围 锁 

假定 我 们 又 对 第 150 字 节 加 锁 ， 那 么 系统 将 会 再 把 3 个 相 邻 的 加 锁 区 
合并 成 一 个 区 “〈 第 100 一 199 字 节 ) 。 其 结果 如 图 14-4 中 的 第 一 个 图 所 
示 ， 又 跟 开始 的 时 候 一 样 了 。 

实例 : 请 求 和 释放 一 把 锁 

为 了 避免 每 次 分 配 flock 结 构 ， 然 后 又 填 入 各 项 信息 ， 可 以 用 图 14-5 
所 示 的 程序 中 的 函数 lock_reg 来 处 理 所 有 这 些 细节 。 








finclude "apue ,hn 
tinclude “fcnt1,h> 


int 


lock_reg(int fd, int cmd, int type, off t offset, int whence, off_t len) 


| 


struct flock lock; 


lock,] type = type; /* E RDLCK, F WRLCK, F UNLCK */ 

lock. start = offset; /* byte offset, relative to 1 whence */ 
lock,] whence = whence;  /* SEEK SET, SEEK CUR, SEEK END */ 
lock. 1 len = len; /* bytes (0 means to EOF) */ 


TPR 








return (fcntl (fd, cmd, &lock)); 


图 14-5 加 锁 或 解锁 一 个 文件 区 域 的 函数 
因为 大 多 数 锁 调用 是 加 锁 或 解锁 一 个 文件 区 域 “ 命 令 F_GETLK 很 





少 使 用 ) ， 故 通 癌 使 用 下 列 5 个 宏 中 的 一 个 ， 这 5 个 宏 都 定义 在 apue.h 中 
〈《 见 附录 B) o 


数 。 


#define read_lock(fd,offset,whence,len) \ 

lock_reg((fd), F_LSETLK, F_RDLCK, (offset), (whence), (len)) 
#define readw_lock(fd,offset,whence,len) \ 

lock_reg((fd), F_LSETLKW, F_RDLCK, (offset), (whence), (len)) 
#define write_lock(fd,offset,whence,len) \ 

lock_reg((fd), F_LSETLK, F_WRLCK, (offset), (whence), (len)) 
#define writew_lock(fd,offset,whence,len) \ 

lock_reg((fd), F_LSETLKW, F_WRLCK, (offset), (whence), (len)) 
#define un_lock(fd,offset,whence,len) \ 

lock_reg((fd), F_LSETLK, F_UNLCK, (offset), (whence), (len)) 
我 们 有 目的 地 用 与 lseek 函 数 同样 的 顺序 定义 了 这 些 宏 中 的 前 3 个 参 





实例 : 测试 一 把 锁 

图 14-6 中 定义 了 一 个 函数 lock _ test， 我 们 将 用 它 测试 一 把 锁 。 
finclude "apue ,hn 
include <fentl.h> 


pidt 
lock test (int fd, int type, off t offset, int whence, off t len) 
| 

struct flock lock; 


lock. 1 type = type; /* F RDLCK or F WRLCK */ 

lock,] start = offset; /* byte offset, relative to 1 whence */ 
lock.] whence = whence;  /* SEEK SET, SEEK CUR, SEEK END */ 
lock,] len = len; /* #bytes (0 means to BOF) */ 








if (fentl (fd, F GETIK, glock) < 0) 
err sys("fcntl error"); 


1f (lock,] type == F UNLCK) 
return (0); /* false, region isn't locked by another proc */ 
return (lock,l pid); /* true, return pid of lock owner */ 


图 14-6 测试 一 个 锁 条 件 的 函数 
如 果 存 在 一 把 锁 ， 它 阻塞 由 参数 指定 的 锁 请 求 ， 则 此 函数 返回 持 有 
这 把 现 有 锁 的 进程 的 进程 ID， 人 否则 此 函数 返回 0。 通 常用 下 面 两 个 宏 来 
调用 此 函数 《它们 也 定义 在 apue.h 中 ) 。 
#define is_read_lockable(fd, offset, whence, len) \ 
(lock_test((fd), F_RDLCK, (offset), (whence), (len)) == 0) 


#define is_write_lockable(fd, offset, whence, len) \ 
(lock_test((fd), F_WRLCK, (offset), (whence), (len)) == 0) 

注意 ， 进 程 不 能 使 用 lock_test 函数 测试 它 上 自己 是 否 在 文件 的 某 一 部 
分 持 有 一 把 锁 。F_GETLK 命令 的 定义 说 明 ， 返 回信 息 指 示 是 否 有 现 有 
的 锁 阻 止 调用 进程 设置 它 自己 的 锁 。 因 为 FE_SETLK 和 F_SETLKW 命 令 
总 是 蔡 换 调用 进程 现 有 的 锁 〈 知 已 存在 ) ， 所 以 调用 进程 决 不 会 阻塞 在 
己 持 有 的 锁 上 ， 于 是 ，F_GETLK 命 令 决 不 会 报告 调用 进程 自己 持 有 
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实例 : 死 锁 

如 果 两 个 进程 相互 等 待 对方 持 有 并 且 不 释放 (锁定 ) 的 资源 时 ， 则 
这 两 个 进程 就 处 于 死 锁 状 态 。 如 果 一 个 进程 已 经 控制 了 文件 中 的 一 个 加 
锁 区 域 ， 然 后 它 又 试图 对 另 一 个 进程 控制 的 区 域 加 锁 ， 那 么 它 就 会 休 
眠 ， 在 这 种 情况 下 ， 有 发 生死 锁 的 可 能 性 。 

图 14-7 所 示 的 程序 给 出 了 一 个 死 锁 的 例子 。 子 进程 对 第 0 字 节 加 
锁 ， 父 进程 对 第 1 字 节 加 锁 。 然 后 ， 它 们 中 的 每 一 个 又 试图 对 对 方 已 经 
加 锁 的 字 节 加 锁 。 在 该 程序 中 使 用 了 8.9 节 中 介绍 的 父 进程 和 子 进程 同 
步 例 程 (TELL _xxx 和 WAIT_xxx) ， 以 便 每 个 进程 能 够 等 待 男 一 个 进程 
获得 它 设置 的 第 一 把 锁 。 














finclude "apue.h" 
#include <fcntl.h> 


static void 
lockabyte(const char *name, int fd, off t offset) 
| 
if (writew lock(fd, offset, SEEK SET, 1) < 0) 
err_sys("%s; writew_lock error", name); 
printf ("%s: got the lock, byte $lld\n", name, (long long) offset) ; 


int 

main (void) 

| 
int fd; 
pidt pid; 
/* 


* Create a file and write two bytes to it. 


| 


if ((fd = creat("templock", FILE MODE)) < 0) 
err sys("creat error"); 

if (write(fd, "ab", 2) != 2) 
err sys("write error"); 


TELL WAIT(); 
if ((pid = fork()) < 0) { 
err_sys("fork error"); 
} else if (pid == 0) | /* child #/ 
lockabyte("child", fd, 0); 
TELL PARENT (getppid()); 
WAIT PARENT () ; 
lockabyte("child", fd, 1); 
| else { /* parent */ 
lockabyte("parent", fd, 1); 
TELL CHILD (pid); 
WAIT CHILD(); 
lockabyte("parent", fd, 0); 





| 


exit (0); 

图 14-7 死 锁 检 测 实例 
运行 图 14-7 中 的 程序 得 到 : 
$ ./a.out 


parent: got the lock, byte 1 

child: got the lock, byte 0 

parent: writew_lock error: Resource deadlock avoided 

child: got the lock, byte 1 

检测 到 死 锁 时 ， 内 核 必 须 选 择 一 个 进程 接收 出 错 返 回 。 在 本 实例 


中 ， 选 择 了 父 进程 ， 但 这 是 一 个 实现 细节 。 在 茶 些 系统 上 ， 子 进程 总 是 
接 到 出 错 信息 ， 在 另 一 些 系统 上 ， 父 进程 总 是 接 到 出 错 信息 。 在 某 些 系 
统 上 ， 当 试图 使 用 多 把 锁 时 ， 有 时 是 子 进程 接 到 出 错 信息 ， 有 时 则 是 父 
进程 接 到 出 错 信息 。 

3. 锁 的 隐 含 继承 和 释放 

关于 记录 锁 的 自动 继承 和 释放 有 3 条 规则 。 

(1) 锁 与 进程 和 文件 两 者 相关 联 。 这 有 两 重 含义 : 第 一 重 很 明 
显 ， 当 一 个 进程 终止 时 ， 它 所 建立 的 锁 全 部 释放 ; 第 二 重 则 不 太 明 显 ， 
无 论 一 个 摘 述 符 何 时 关闭 ， 该 进程 通过 这 一 描述 符 引 用 的 文件 上 的 任何 
一 把 锁 都 会 释放 (这些 锁 都 是 该 进程 设置 的 ) 。 这 就 意味 着 ， 如 果 执 行 
下 列 4 步 : 

fd1 = open(pathname, ...); 

read_lock(fd1, ...); 

fd2 = dup(fd1); 

close(fd2); 

则 在 close(fd2) 后 ， 在 fd1 上 设置 的 锁 被 释放 。 如 果 将 dup 蔡 换 为 
open， 其 效果 也 一 样 : 

fd1 = open(pathname, ...); 

read_lock(fd1, ...); 

fd2 = open(pathname, ...) 

close(fd2); 

(2) 由 fork 产 生 的 子 进程 不 继承 父 进程 所 设置 的 锁 。 这 意味 着 ， 寿 
一 个 进程 得 到 一 把 锁 ， 然 后 调用 fork， 那 么 对 于 父 进程 获得 的 锁 而 言 ， 
子 进 程 被 视 为 另 一 个 进程 。 对 于 通过 fork 从 父 进程 处 继承 过 来 的 描述 
符 ， 子 进程 需要 调用 fcntl 才能 获得 它 自 己 的 锁 。 这 个 约束 是 有 道理 
的 ， 因 为 锁 的 作用 是 阻止 多 个 进程 同时 写 同 一 个 文件 。 如 有 末 子 进程 通过 
fork 继 承 父 进程 的 锁 ， 则 父 进程 和 子 进 程 就 可 以 同时 写 同 一 个 文件 。 

(3) 在 执行 exec 后 ， 新 程序 可 以 继承 原 执行 程序 的 锁 。 但 是 注 
意 ， 如 有 果 对 一 个 文件 描述 符 设置 了 执行 时 关闭 标志 ， 那 么 当 作 为 exec 的 
一 部 分 关闭 该 文件 描述 符 时 ， 将 释放 相应 文件 的 所 有 锁 。 

4. FreeBSD 实 现 

先 简要 地 观察 FreeBSD 实 现 中 使 用 的 数据 结构 。 这 会 帮助 我 们 进 一 
步 理解 记录 锁 的 自动 继承 和 释放 的 第 一 条 规则 ， 锁 与 进程 和 文件 两 者 相 


联 。 
考虑 一 个 进程 ， 它 执行 下 列 语句 《忽略 出 错 返 回 ) 。 


fd1 = open(pathname, ...); 
write_lock(fd1, 0, SEEK_SET, 1); /* parent write locks byte 0 */ 
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if ((pid = fork()) > 0) { /* parent */ 
fd2 = dup(fd1); 
fd3 = open(pathname., ...); 
} else if (pid == 0) { 
read_lock(fd1, 1, SEEK_SET, 1); /* child read locks byte 1 */ 
} 
pause(); 


图 14-8 显 示 了 父 进程 和 子 进程 暂停 〈 执 行 pause0) 后 的 数据 结构 情 








父 进程 表 项 





文件 表 项 


struct lockf 





父 进 程 ID 









struct lockf entry 


起 始 偏 移 基 
结束 偏 移 革 


struct lock owner 


所 有 者 信息 


子 进程 ID 





图 14-8 关于 记录 锁 的 FreeBSD 数 据 结构 

前 面 已 经 给 出 了 open、fork 以 及 dup 调 用 后 的 数据 结构 〈( 见 图 3-9 和 
图 8-2) 。 有 了 记录 锁 后 ， 在 原来 的 这 些 图 上 新 加 了 lockf 结 构 ， 它 们 由 i 
节点 结构 开始 相互 链接 起 来 。 每 个 lockf 结 构 描 述 了 一 个 给 定 进程 的 一 个 
加 锁 区 域 (由 偏 移 量 和 长 度 定 义 的 ) 。 图 中 显示 了 两 个 lockf 结 构 ， 一 个 
是 由 父 进程 调用 write_lock 形 成 的 ， 男 一 个 则 是 由 子 进 程 调用 read_lock 
形成 的 。 每 一 个 结构 都 包含 了 相应 的 进程 ID。 

在 父 进程 中 ， 关 闭 fda1、fd2 或 fd3 中 的 任意 一 个 都 将 释放 由 父 进程 设 
置 的 写 锁 。 在 关闭 这 3 个 摘 述 符 中 的 任意 一 个 时 ， 内 核 会 从 该 描述 符 所 
关联 的 i 节点 开始 ， 逐 个 检查 lockf 链 接 表 中 的 各 项 ， 并 释放 由 调用 进程 
FAN IER. AIP CEASED) 父 进程 是 用 这 3 个 描述 中 的 
哪 一 个 来 设置 这 把 锁 的 。 

实例 

在 图 13-6 所 示 的 程序 中 ， 我 们 了 解 到 ， 守 护 进 程 可 用 一 把 文件 锁 来 
保证 只 有 该 守护 进程 的 唯一 副本 在 运行 。 图 14-9 展 示 了 lockfile 函 数 的 实 
现 ， 和 守护 进程 可 用 该 图 数 在 文件 上 加 写 锁 。 














tinclude <unistd.h> 
#include <fentl.h> 


int 
lockfile(int fd) 


| 
struct flock fl; 


fl.l_ type = F WRLCK; 
fl,l start = 0; 

fl.l whence = SEEK SET; 
fll len = 0; 








return (fent] (fd, F SETLK, &f£1)); 


图 14-9 在 文件 整体 上 加 一 把 写 锁 





另 一 种 方法 是 用 write _ lock 函数 定义 lockfile 函 数 。 

#define lockfile(fd) write_lock((fd), 0, SEEK_SET, 0) 

5. 在 文件 尾 端 加 锁 

在 对 相对 于 文件 尾 端的 字 节 范围 加 锁 或 解锁 时 需要 特别 小 心 。 大 多 
数 实现 按照 1_whence 的 SEEK_CUR 或 SEEK_END 值 ， 用 ]_start 以 及 文件 
当前 位 置 或 当前 长 度 得 到 绝对 文件 偏 移 量 。 但 是 ， 常 常 需 要 相对 于 文件 
的 当前 长 度 指 定 一 把 锁 ， 但 又 不 能 调用 fstat 来 得 到 当前 文件 长 度 ， 因 为 
我 们 在 该 文件 上 没有 锁 。“〈 在 fstat 和 锁 调 用 之 间 ， 可 能 会 有 另 一 个 进程 
改变 该 文件 长 度 。) 

考虑 以 下 代码 序列 : 

writew_lock(fd, 0, SEEK_END, 0); 

write(fd, buf, 1); 

un_lock(fd, 0, SEEK_END); 

write(fd, buf, 1); 

该 代码 序列 所 做 的 可 能 并 不 是 你 所 期 望 的 。 它 得 到 一 把 写 锁 ， 该 写 
锁 从 当前 文件 尾 问 起 ， 包 括 以 后 可 能 退 加 写 到 该 文件 的 任何 数据 。 假 
定 ， 访 文件 偏 移 量 处 于 文件 尾 端 时 ， 执 行 第 一 个 write， 这 个 操作 将 文件 
延伸 了 1 个 字 节 ， 而 该 字 节 将 被 加 锁 。 跟 随 其 后 的 是 解锁 操作 ， 其 作用 
是 对 以 后 退 加 写 到 文件 上 的 数据 不 再 加 锁 。 但 在 其 之 前 刚 仍 加 写 的 一 个 
字 节 则 保留 加 锁 状 态 。 当 执行 第 二 个 写 时 ， 文 件 尾 端 又 延伸 了 1 个 字 
节 ， 但 该 字 节 并 未 加 锁 。 由 此 代码 序列 造成 的 文件 锁 状 态 如 图 14-10 所 
不 。 
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图 14-10 文件 区 域 锁 
当 对 文件 的 一 部 分 加 锁 时 ， 内 核 将 指定 的 偏 移 量 变换 成 绝对 文件 偏 
移 量 。 男 外 ， 除 了 指定 一 个 绝对 偏 移 量 (SEEK_SET) 之 外 ，fcntl 还 允 
许 我 们 相对 于 文件 中 的 某 个 点 指定 该 偏 移 量 ， 这 个 点 是 指 当 前 偏 移 量 
(SEEK_CUR) 或 文件 尾 端 (SEEK_END) 。 当 前 偏 移 量 和 文件 尾 端 可 
能 会 不 断 变 化 ， 而 这 种 变化 又 不 应 影响 现 有 锁 的 状态 ， 所 以 内 核 必须 独 
立 于 当前 文件 偏 移 量 或 文件 尾 端 而 记 住 锁 。 
如 果 想 解除 的 锁 中 包括 第 一 次 write 所 写 的 1 个 字 节 ， 那 么 应 指定 长 
度 为 -1。 负 的 长 度 值 表 示 在 指定 偏 移 量 之 前 的 字 节 数 。 
6. 建议 性 锁 和 强制 性 锁 
考虑 数据 库 访 问 例 程 库 。 如 果 该 库 中 所 有 函数 都 以 一 致 的 方法 处 理 
记录 锁 ， 则 称 使 用 这 些 函 数 访问 数据 库 的 进程 集 为 合作 进程 
(cooperating process) 。 如 果 这 些 函 数 是 唯一 地 用 来 访问 数据 库 的 函 
数 ， 那 么 它们 使 用 建议 性 锁 是 可 行 的 。 但 是 建议 性 锁 并 不 能 阻止 对 数据 
库 文件 有 写 权 限 的 任何 其 他 进程 写 这 个 数据 库 文 件 。 不 使 用 数据 库 访 问 
例 程 库 协 同一 致 的 方法 来 访问 数据 库 的 进程 是 非 合 作 进 程 。 
强制 性 锁 会 让 内 核 检 查 每 一 个 open. read 和 write， 验 证 调用 进程 
是 否 违 背 了 正在 访问 的 文件 上 的 某 一 把 锁 。 强 制 性 锁 有 时 也 称 为 强迫 方 


式 锁 (enforcement-mode locking) 。 









































从 图 14-2 中 可 以 看 出 ，Linux 3.2.0 和 Solaris 10 提 供 强 制 性 记录 锁 ， 
而 FreeBSD 8.0 和 Mac OS X 10.6.8 则 不 提供 。 强 制 性 记录 锁 不 是 Single 
UNIX Specification 的 组 成 部 分 。 在 Linux 中 ， 如 果 用 户 想 要 使 用 强制 性 
锁 ， 则 需 要 在 各 个 文件 系统 基础 上 用 mount 命 令 的 -o mand 选 项 来 打开 该 
HLHI 

对 一 个 特定 文件 打开 其 设置 组 ID 位 、 关 闭 其 组 执行 位 便 开 启 了 对 该 
文件 的 强制 性 锁 机 制 (回忆 图 4-12〉。 因 为 当 组 执行 位 关闭 时 ， 设 置 组 
ID 位 不 再 有 意义 ， 所 以 SVR3 的 设计 者 借用 两 者 的 这 种 组 合 来 指定 对 一 
个 文件 的 锁 是 强制 性 的 而 非 建议 性 的 。 

如 果 一 个 进程 试图 读 (read) 5 (write) 一 个 强制 性 锁 起 作用 的 
文件 ， 而 欲 恋 、 写 的 部 分 又 由 其 他 进程 加 上 了 锁 ， ls oe 
对 这 一 问题 的 回答 取决 于 3 方面 的 因素 : 操作 类 型 (read 或 write) ~ 
他 进程 持 有 的 锁 的 类 型 ( 读 锁 或 SDO 以 及 read 或 write 的 描述 4 

还 是 非 阻塞 的 。 图 14-11 列 出 了 8 种 可 能 性 。 





其 他 进程 在 该 区 域 上 非 阻塞 描述 符 


该 名 类 | 
TA 





图 14-11 强制 性 锁 对 其 他 进程 的 read 和 write 的 影响 

除了 图 14-11 中 的 read 和 write 函数 ， 另 一 个 进程 持 有 的 强制 性 锁 也 会 
对 open 函 数 产 生 影 响 。 通 常 ， 即 使 正在 打开 的 文件 具有 强制 性 记录 锁 ， 
该 open 也 会 成 功 。 随 后 的 read 或 write 依从 于 图 14-11 中 所 示 的 规则 。 但 
是 ， 如 果 欲 打开 的 文件 具有 强制 性 记录 锁 〈 读 锁 或 写 锁 ) ， 而 且 open 调 
用 中 的 标志 指定 为 O_TRUNC 或 O_fCREAT， 则 不 论 是 否 指 定 
O_NONBLOCK，open 都 立即 出 错 返 回 ，ermo 设 置 为 ECAGAIN。 

只 有 Solaris 对 O_CREAT 标 志 处 理 为 出 错 。 当 打开 一 个 具 强 制 性 锁 
的 文件 时 ，Linux 人 允许 指定 O_CREAT 标 志 。 对 O_TRUNC 标 志 产 生 open 
出 错 是 有 意义 的 ， 因 为 对 于 一 个 文件 来 讲 ， 大 另 一 个 进程 持 有 它 的 读 锁 
或 写 锁 ， 那 么 它 就 不 能 被 截 短 为 0。 但 是 对 O_CREAT 标 志 在 返 回 时 设置 
出 错 束 没什么 意义 了 ， 因 为 该 标志 表示 ， 只 有 在 该 文件 不 存在 时 才 创 
但 由 于 男 一 个 进程 持 有 该 文件 的 记录 锁 ， 所 以 该 文件 肯定 是 存在 














这 种 open 的 锁 冲突 处 理 方式 可 能 会 导致 令 人 惊异 的 结果 。 在 开发 本 
节 习 题 的 时 候 ， 我 们 曾 编 写 过 一 个 测试 程序 ， 它 打开 一 个 文件 (其 模式 
指定 为 强制 性 锁 ) ， 对 该 文件 整体 设置 一 把 读 锁 ， 然 后 休眠 一 段 时 间 。 

(回忆 图 14-11， 读 锁 应 当 阻 止 其 他 进程 写 该 文件 。) 在 这 上 段 休眠 时 间 
a 用 某 些 典型 的 UNIX 系 统 程序 和 操作 符 对 该 文件 进行 处 理 ， 发 现下 
列 情况 。 

“可 用 ed 编辑 器 对 该 文件 进行 编辑 操作 ， 而 且 编 辑 结 果 可 以 写 回 磁 
He) 强制 性 记录 锁 根 本 不 起 作用 。 用 某 些 UNIX 系 统 版 本 提供 的 系统 调 
用 跟踪 特性 ， 对 ed 操作 进行 跟踪 分 析 发 现 ，ed 将 新 内 容 写 到 一 个 临时 文 
件 中 ， 然 后 删除 原文 件 ， 最 后 将 临时 文件 名 改 为 原文 件 名 。 强 制 性 锁 机 
制 对 unlink 函 数 没 有 影响 ， 于 是 这 一 切 就 发 生 了 。 

在 FreeBSD 8.0 和 Solaris 10 中 ， 用 truss(1) 命 令 可 以 得 到 一 个 进程 的 
系统 调用 跟踪 信息 。Linux ”3.2.0 出 于 相同 的 目的 提供 了 strace(1) 命 令 。 
Mac OS X 10.6.8 提 供 了 dtruss(1m) 命 令 来 追踪 系统 调用 ， 但 该 命令 的 使 
用 需要 超级 用 户 的 权限 。 

“不 能 用 vi 编辑 器 编辑 该 文件 。vi 可 以 读 该 文件 的 内 容 ， 但 是 如 果 
试图 将 新 的 数据 写 到 该 文件 中 ， 束 会 出 错 返 回 CEAGAIN) 。 如 果 试 图 
将 新 数据 退 加 写 到 该 文件 中 ， 则 write 阻塞 。vi 的 这 种 行为 与 我 们 所 希望 

“使 用 Korn ”shell 的 > 和 >> 操 作 符 重 写 或 退 加 写 该 文件 ， 会 产生 出 误 
信息 “cannot create”。 

“在 Bourne shell 下 使 用 > 操作 符 也 会 出 错 ， 但 是 使 用 >> 操 作 符 时 只 阻 
塞 ， 在 解除 强制 性 锁 后 会 继续 进行 处 理 。《〈 这 两 种 shel 在 执行 退 加 写 操 
作 时 之 所 以 会 产生 的 差异 ， 是 因为 Korn shellLLO_CREAT#IO_APPEND 
标志 打开 文件 ， 而 上 面 已 提 及 指定 DO_CREAT 会 产生 出 错 返 回 。 但 是 ， 
Bourne shell 在 该 文件 已 存在 时 并 不 指定 O_CREAT， 所 以 open 成 功 ， 而 
下 一 个 write 则 阻塞 。) 产生 的 结果 随 所 用 操作 系统 版 本 的 不 同 而 不 同 。 
从 这 样 一 个 习题 中 可 见 ， 在 使 用 强制 性 锁 时 还 需 有 所 警惕 。 从 ed 实例 可 
以 看 到 ， 强 制 性 锁 是 可 以 设法 避 开 的 。 

一 个 恶意 用 户 可 以 使 用 强制 性 记录 锁 ， 对 大 家 都 可 读 的 文件 加 一 把 
读 锁 ， 这 样 就 能 阻止 任何 人 写 该 文件 (当然 ， 该 文件 应 当 是 强制 性 锁 机 
制 起 作用 的 ， 这 可 能 要 求 该 用 户 能 够 更 改 该 文件 的 权限 位 ) 。 考 虑 一 个 
数据 库 文 件 ， 它 是 大 家 都 可 读 的 ， 并 且 是 强制 性 锁 机 制 起 作用 的 。 如 果 
人 其 他 进程 束 不 能 再 写 该 
文件 。 

实例 

图 14-12 中 的 程序 可 以 用 于 确定 一 个 系统 是 人 否 文 持 强制 性 锁 机 制 。 

















#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#include <sys/wait.h> 


int 
main(int argc, char *argv[]) 


{ 


int fd? 
pid t pid; 
char DUE [S15 
struct stat statbuf; 


if (agge != 2) { 
fprintf(stderr, "usage: %s filename\n", argv[0]); 
exit(1); 


if ((fd = open(argv[1], O_RDWR | O CREAT | O TRUNC, FILE_MODE)) < 0) 
err_sys("open error"); 

if (write(fd, "abcdef", 6) != 6) 
err_sys("write error"); 


/* turn on set-group-ID and turn off group-execute */ 

if (fstat(fd, &statbuf) < 0) 
err_sys("fstat error"); 

if (fchmod(fd, (statbuf.st_mode & ~S_IXGRP) | S_ISGID) < 0) 
err_sys("fchmod error"); 


TELL_WAIT (); 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 
} else if (pid > 0) { /* parent */ 
/* write lock entire file */ 
1f (write_lock(fd, 0, SEEK_SET, 0) < 0) 
err_sys("write_lock error"); 


TELL CHILD (pid); 
if (waitpid(pid, NULL, 0) < 0) 
err sys ("waitpid error"); 
} else { /* child */ 
WAIT PARENT (); /* wait for parent to set lock */ 


set fl(fd, O_NONBLOCK) ; 


/* first let's see what error we get if region is locked */ 
if (read_lock(fd, 0, SEEK SET, 0) != -1) /* no wait */ 


err sys("child: read lock succeeded"); 
printf ("read lock of already-locked region returns $d\n", 
errno); 


/* now try to read the mandatory locked file */ 
if (lseek (fd, 0, SEEK SET) == -1) 
err sys("lseek error"); 
if (read(fd, buf, 2) < 0) 
err ret("read failed (mandatory locking works)"); 
else 
printf ("read OK (no mandatory locking), buf = $2.2s\n", 
buf) ; 
exit (0) ; 





图 14-12 确定 是 否 支 持 强 制 性 锁 

此 程序 首先 创建 一 个 文件 ， 并 使 强制 性 锁 机 制 对 其 起 作用 。 然 后 程 
序 分 出 一 个 父 进程 和 一 个 子 进程 。 父 进程 对 整个 文件 设置 一 把 写 锁 ， 子 
进程 则 先 将 该 文件 的 描述 符 设 置 为 非 阻 压 的 ， 然 后 企图 对 该 文件 设置 一 
把 读 锁 ， 我 们 期 望 这 会 出 错 返 回 ， 并 希望 看 到 系统 返回 是 EACCES 或 
EAGAIN。 接 着 ， 子 进程 将 文件 读 、 写 位 置 调整 到 文件 起 点 ， 并 试图 读 
(read) 该 文件 。 如 果 系 统 提 供 强 制 性 锁 机 制 ， 则 read 应 返回 EACCES 
或 EAGAIN 〈 因 为 该 描述 符 是 非 阻 豆 的 ) ， 人 否则 read 返 回 所 读 的 数据 。 
在 Solaris 10 上 运行 此 程序 《该 系统 文 持 强制 性 锁 机 制 ) ， 得 到 : 

$ ./a.out temp.lock 

read_lock of already-locked region returns 11 

read failed (mandatory locking works): Resource temporarily 
unavailable 

得 看 系统 头 文件 或 intro(2) 手 册页 ， 可 以 看 到 errno 值 11 对 应 于 
EAGAIN。 若 在 FreeBSD 8.0 运 行 此 程序 ， 则 得 到 ; 








$ ./a.out temp.lock 

read_lock of already_locked region returns 35 

read OK (no mandatory locking), buf = ab 

其 中 ，ermo 值 35 对 应 于 EAGAIN。 该 系统 不 支持 强制 性 锁 。 

实例 

让 我 们 回 到 本 市 的 第 一 个 问题 ， 当 两 个 人 同时 编辑 同一 个 文件 时 将 
会 怎样 呢 ? 一 般 的 UNIX 系统 文本 编辑 髓 并 不 使 用 记录 锁 ， 所 以 对 此 问 
题 的 回答 仍然 是 ， 该 文件 的 最 后 结果 取决 于 写 该 文件 的 最 后 一 个 进程 。 

某 些 版 本 的 vi 编辑 器 使 用 建议 性 记录 锁 。 即 使 我 们 使 用 这 种 版 本 的 
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使 用 它 《 如 采 我 们 有 该 编辑 器 的 源 代 码 ) 。 如 果 没 有 该 编辑 器 的 源 代 
码 ， 那 么 可 以 试 一 试 下 述 方法 。 编 写 一 个 vi 的 前 端 程序 。 该 程序 立即 调 
用 fork， 然 后 父 进 程 只 等 待 子 进程 完成 。 子 进程 打开 在 命令 行 中 指定 的 
文件 ， 使 强制 性 锁 起 作用 ， 对 整个 文件 设置 一 把 写 锁 ， 然 后 执行 Vi。 在 
vi 运行 时 ， 该 文件 是 加 了 写 锁 的 ， 所 以 其 他 用 户 不 能 修改 它 。 当 vi 结束 
时 ， 父 进程 从 wait 返 回 ， 自 编 的 前 病程 序 结束 。 

虽然 可 以 编写 这 种 类 型 的 小 型 前 病程 序 ， 但 它 却 不 起 作用 。 问 题 出 
在 大 多 数 编辑 器 该 它们 的 输入 文件 ， 然 后 关闭 它 。 只 要 引用 被 编辑 文件 
的 描述 符 关 财 了 ， 那 么 加 在 该 文件 上 的 锁 就 被 释放 了 。 这 意味 着 ， 在 编 
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这 个 前 端 程序 中 没有 任何 方法 可 以 阻止 这 一 点 。 

在 第 20 半 中 ， 我 们 将 使 用 数据 库 函 数 库 中 的 记录 锁 来 提供 多 个 进 
程 的 并 发 访问 。 我 们 还 将 提供 一 些 时 间 测 量 ， 以 观察 记录 锁 对 进程 的 影 


Ie] 。 








14.4 TO 多 路 转 接 


当 从 一 个 描述 符 读 ， 然 后 又 写 到 另 一 个 描述 符 时 ， 可 以 在 下 列 形式 
的 循环 中 使 用 阻塞 IO: 

while ((n=read(STDIN_FILENO, buf, BUFSIZ)) > 0) 

if (write(STDOUT_FILENO, buf, n) != n) 
err_sys("write error"); 

这 种 形式 的 阻塞 VO 到 处 可 见 。 但 是 如 果 必 须 从 两 个 描述 符 读 ， 又 
将 如 何 呢 ? 在 这 种 情况 下 ， 我 们 不 能 在 任 一 个 描述 符 上 进行 阻塞 读 
(read) ， 人 否则 可 能 会 因为 被 阻塞 在 一 个 描述 符 的 读 操作 上 而 导致 另 一 
所 以 为 了 处 理 这 种 情况 需要 另 一 种 不 

让 我 们 观察 telnet(1) 命 令 的 结构 。 该 程序 从 终端 (标准 输入 ) 读 ， 
将 所 得 数据 写 到 网 络 连 接 上 ， 同 时 从 网 络 连 接 读 ， 将 所 得 数据 写 到 终端 
上 《标准 输出 ) 。 在 网 络 连接 的 另 一 端 ，telnetd 守 护 进程 读 用 户 键入 的 
命令 ， 并 将 所 读 到 的 送 给 ”shell， 这 如 同 用 户 登 录 到 远程 机 器 上 一 样 。 
telnetd 守护 进程 将 执行 用 户 键入 命令 而 产生 的 输出 通过 telnet 命令 送 回 
给 用 户 ， 并 显示 在 用 户 终端 上 。 图 14-13 显 示 了 这 种 工作 情景 。 


终端 上 telnet telnetd 
的 用 户 命令 守护 进程 


图 14-13 telnet 程 序 概观 

telnet ”进程 有 两 个 输入 ， 两 个 输出 。 我 们 不 能 对 两 个 输入 中 的 任 一 
个 使 用 阻塞 read， 因 为 我 们 不 知道 到 底 哪 一 个 输入 会 得 到 数据 。 

处 理 这 种 特殊 问题 的 一 种 方法 是 ， 将 一 个 进程 变 成 两 个 进程 (用 
fork) ， 每 个 进程 处 理 一 条 数据 通路 。 图 14-14 中 显示 了 这 种 安排 。 
(System V 的 uucp 通 信和 包 提 供 了 cu(1) 命 令 ， 其 结构 与 此 相似 。) 








telnet 命令 


( 父 进 程 ) 


终端 上 telnetd 
( 子 进 程 ) 


图 14-14 使 用 两 个 进程 实现 telnet 程 序 

如 果 使 用 两 个 进程 ， 则 可 使 每 个 进程 都 执行 阻塞 read。 但 是 这 也 产 
生 了 问题 : 操作 什么 时 候 终 止 ? 如 果子 进程 接收 到 文件 结束 符 (telnetd 
守护 进程 使 网 络 连 接 断 开 ) ， 那 么 该 子 进程 终止 ， 然 后 父 进程 接收 到 
SIGCHLD 信号。 但是， 如 果 父 进程 终止 〈 用 户 在 终端 上 键入 了 文件 结 
WR) ， 那 么 父 进程 应 通知 子 进程 停止 。 为 此 可 以 使 用 一 个 信号 〈 如 
SIGUSR1) ， 但 这 使 程序 变 得 更 加 复杂 。 

我 们 可 以 不 使 用 两 个 进程 ， 而 是 用 一 个 进程 中 的 两 个 线程 。 虽 然 这 
避免 了 终止 的 复杂 性 ， 但 却 要 求 处 理 两 个 线程 之 间 的 同步 ， 在 复杂 性 方 
面 这 可 能 会 得 不 偿 失 。 

另 一 个 方法 是 仍旧 使 用 一 个 进程 执行 该 程序 ， 但 使 用 非 阻塞 O 读 
取 数 据 。 其 基本 思想 是 : 将 两 个 输入 描述 符 都 设置 为 非 阻 塞 的 ， 对 第 一 
个 描述 符 发 一 个 read。 如 果 该 输入 上 有 数据 ， 则 读数 据 并 处 理 它 。 如 果 
无 数据 可 读 ， 则 该 调用 立即 返回 。 然 后 对 第 二 个 描述 符 作 同样 的 处 理 。 
在 此 之 后 ， 等 待 一 定 的 时 间 〈 可 能 是 若干 秒 ) ， 然 后 再 尝试 从 第 一 个 描 
述 符 读 。 这 种 形式 的 循环 称 为 轮 询 。 这 种 方法 的 不 足 之 处 是 浪费 CPU 时 
间 。 大 多 数 时 间 实 际 上 是 无 数据 可 读 ， 因 此 执行 read 系 统 调 用 浪费 了 时 
间 。 在 每 次 循环 后 要 等 多 长 时 间 再 执行 下 一 轮 循环 也 很 难 确定 。 虽 然 轮 
询 技术 在 支持 非 阻 塞 VO 的 所 有 系统 上 都 可 使 用 ， 但 是 在 多 任务 系统 中 
应 当 避 免 使 用 这 种 方法 。 

还 有 一 种 技术 称 为 异步 JO Casynchronous I/O) 。 利 用 这 种 技术 ， 
进程 告诉 内 核 ， 当 描述 符 准备 好 可 以 进行 WO 时 ， 用 一 个 信号 通知 它 。 
这 种 技术 有 两 个 问题 。 首 先 ， 尺 管 一 些 系统 提供 了 各 自 的 受 限 形式 的 异 
步 JO， 但 POSIX 采 纳 了 另外 一 套 标准 化 接口 ， 所 以 可 移植 性 成 为 一 个 
问题 (以 前 ，POSIX 异 步 /O 是 Single UNIX Specification 中 是 可 选 设施 ， 
但 现在 ， 这 些 接口 在 SUSv4 中 是 必需 的 ) o System V 提供 了 SIGPOLL 
信号 来 支持 受 限 形 式 的 异步 ”WO， 但 是 仅 当 描述 符 引 用 STREAMS 设 备 
时 ， 此 信号 才 起 作用 。BSD 有 一 个 类 似 的 信号 SIGIO， 但 也 有 类 似 的 限 
制 ， 仅 当 描述 符 引 用 终端 设备 或 网 络 时 它 才 能 起 作用 。 























这 种 技术 的 第 二 个 问题 是 ， 这 种 信号 对 每 个 进程 而 言 只 有 1 个 
(SIGPOLLEXSIGIO) 。 如 果 使 该 信号 对 两 个 描述 符 都 起 作用 《在 我 们 
正在 讨论 的 实例 中 ， 从 两 个 描述 符 读 ) ， 那 么 进程 在 接 到 此 信号 时 将 无 
法 判别 是 哪 一 个 描述 符 准 备 好 了 。 尽 管 POSIX.1 异 步 JO 接 口 允许 选择 哪 
个 信号 作为 通知 ， 但 能 用 的 信号 数量 仍 远 小 于 潜在 的 打开 文件 描述 符 的 
数量 。 为 了 确定 是 哪 一 个 描述 符 准备 好 了 ， 仍 需 将 这 两 个 描述 符 都 设置 
为 非 阻塞 的 ， 并 顺序 尝试 执行 1JO。 我 们 将 在 14.5 节 讨论 异步 IO。 

一 种 比较 好 的 技术 是 使 用 MO 多 路 转 接 (1/O multiplexing) 。 为 了 使 
用 这 种 技术 ， 先 构造 一 张 我 们 感 兴 趣 的 描述 符 “〈 通 常 都 不 止 一 个 ) 的 列 
表 ， 然 后 调用 一 个 函数 ， 直 到 这 些 描述 符 中 的 一 个 已 准备 好 进行 IO 
时 ， 该 函数 才 返 回 。poll、pselect 和 select 这 3 个 函数 使 我 们 能 够 执行 IO 
多 路 转 接 。 在 从 这 些 函 数 返回 时 ， 进 程 会 被 告知 哪些 描述 符 已 准备 好 可 
以 进行 IO。 

POSIX 指 定 ， 为 了 在 程序 中 使 用 select， 必 须 包括 <sys/select.h>。 但 
较 老 的 系统 还 要 求 包括 <sys/types.h>、<sys/time.h> 和 <unistd.h>。 查 看 
select 手 册页 可 以 弄 清 楚 你 的 系统 都 文 持 什么 。 

IO 多 路 转 接 在 4.2BSD 中 是 用 select 函 数 提 供 的 。 虽 然 该 函数 主要 用 
于 终端 O 和 网 络 UO， 但 它 对 其 他 描述 符 同 样 是 起 作用 的 。SVR3 在 增加 
STREAMS 机 制 时 增加 了 poll 函 数 。 但 在 SVR4 之 前 ，poll 只 对 STREAMS 
设备 起 作用 。SVR4 文 持 对 任意 描述 符 起 作用 的 poll。 


14.4.1 函数 select 和 pselect 


在 所 有 POSIX 兼 容 的 平台 上 ，select 函 数 使 我 们 可 以 执行 JO 多 路 转 
接 。 传 给 select 的 参数 告诉 内 核 : 

我 们 所 关心 的 描述 符 ; 

对 于 每 个 描述 符 我 们 所 关心 的 条 件 〈 是 人 否 想 从 一 个 给 定 的 描述 符 
是 否 想 写 一 个 给 定 的 描述 符 ， 是 否 关 心 一 个 给 定 搬 述 符 的 异常 条 

) ; 

“愿意 等 待 多 长 时 间 【〈 可 以 永远 等 待 、 等 待 一 个 固定 的 时 间或 者 根 
本 不 等 待 ) 。 

从 Select 返回 时 ， 内 核 告诉 我 们 : 

“已 准备 好 的 描述 符 的 总 数量 ; 

对 于 读 、 写 或 异常 这 3 个 条 件 中 的 每 一 个 ， 哪 些 描 述 符 已 准备 好 。 

使 用 这 种 返回 信息 ， 就 可 调用 相应 的 IO ” 子 数 (一 般 是 read ”或 
write) ， 并 且 确 知 该 图 数 不 会 阻塞 。 


#include <sys/select.h> 


int select(int maxfdp1, fd_set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 
struct timeval *restrict tvptr); 
返回 值 : 准备 就 绪 的 描述 符 数 目 ; 知 超 时 ， 返 回 0; 吞 出错， 返回 -1 

先 来 说 明 最 后 一 个 参数 ， 它 指定 愿意 等 待 的 时 间 长 上 度 ， 单 位 为 秒 和 
微 秒 (回忆 4.20 节 ) 。 有 以 下 3 种 情况 。 

tvptr == NULL 

永远 等 待 。 如 果 捕 捉 到 一 个 信号 则 中 断 此 无 限期 等 待 。 当 所 指定 的 
描述 符 中 的 一 个 已 准备 好 或 捕捉 到 一 个 信号 则 返回 。 如 果 捕 捉 到 一 个 信 
号 ， 则 select 返 回 -1，errno 设 置 为 EINTR。 

tvptr->tv_sec == 0 && tvptr->tv_usec == 

根本 不 等 待 。 测 试 所 有 指定 的 描述 符 并 立即 返回 。 这 是 轮 询 系 统 找 
到 多 个 描述 符 状 态 而 不 阻 蹇 select 函数 的 方法 。 

tvptr->tv_sec != 0 || tvptr->tv_usec != 0 

等 待 指定 的 秒 数 和 微 秒 数 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 当 指 
定 的 时 间 值 已 经 超过 时 立即 返回 。 如 果 在 超时 到 期 时 还 没有 一 个 描述 符 
准备 好 ， 则 返回 值 是 0。《“《 如 果 系 统 不 提供 微 秒 级 的 精度 ， 则 tvptr- 
>tv_usec 值 取 整 到 最 近 的 支持 值 。) 与 第 一 种 情况 一 样 ， 这 种 等 待 可 被 
捕捉 到 的 信号 中 断 。 

POSIX.1 允 许 实现 修改 timeval 结 构 中 的 值 ， 所 以 在 select 返 回 后， 你 
不 能 指望 该 结构 仍旧 保持 调用 select 之 前 它 所 包含 的 值 。FreeBSD 8.0, 
Mac OS X 10.6.8 和 Solaris 10 都 保持 该 结构 中 的 值 不 变 。 但 是 ， 若 在 超时 
ile 尚未 到 期 时 ，select 就 返回 ， 那 么 Linux 3.2.0 将 用 剩余 时 间 值 更 新 该 
结 名 。 

中 间 3 个 参数 readfds、writefds 和 exceptfds 是 指 加 描述 符 集 的 指针 。 
这 3 个 摘 述 符 集 说 明了 我 们 关心 的 可 读 、 可 写 或 处 于 异常 条 件 的 描述 符 
集合 。 每 个 描述 符 集 存储 在 一 个 fd_set 数 据 类 型 中 。 这 个 数据 类 型 是 由 
实现 选择 的 ， 它 可 以 为 每 一 个 可 能 的 摘 述 符 保持 一 位 。 我 们 可 以 认为 它 
只 是 一 个 很 大 的 字 市 数组 ， 如 图 14-15 所 示 。 
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图 14-15 对 select 指 定 读 、 写 和 异常 条 件 描 述 符 


对 于 fd_set 数 据 类 型 ， 唯 一 可 以 进行 的 处 理 是 : 分 配 一 个 这 种 类 型 


的 变量 ， 将 这 种 类 型 的 一 个 变量 值 赋 给 同类 型 的 力 一 个 变量 ， 或 对 这 种 
类 型 的 变量 使 用 下 列 4 个 函数 中 的 一 个 。 





#include <sys/select.h> 
int FD_ISSET(int fd, fd_set *fdset); 
返回 值 : 奋 fd 在 描述 符 集 中 ， 返 回 非 0 值 ; 人 否则， 返回 0 
void FD_CLR(int fd, fd_set *fdset); 
void FD_SET(int fd, fd_set *fdset); 
void FD_ZERO(fd_set *fdset); 
这 些 接 口 可 实现 为 宏 或 函数 。 调 用 FD_ZERO 将 一 个 fd_set 变 量 的 所 


有 位 设置 为 0。 要 开启 描述 符 集 中 的 一 位 ， 可 以 调用 FD_SET。 调 用 
FD_CLR 可 以 清除 一 位 。 最 后 ， 可 以 调用 FD_ISSET 测 试 描述 符 集 中 的 一 
个 指定 位 是 否 已 打开 。 


在 声明 了 一 个 描述 符 集 之 后 ， 必 须 用 FD_ZERO 将 这 个 描述 符 集 置 


为 0， 然 后 在 其 中 设置 我 们 关心 的 各 个 描述 符 的 位 。 具 体操 作 如 下 所 


ZN: 


fd_set rset; 

int fd; 

FD_ZERO(&rset); 

FD_SET(fd, &rset); 
FD_SET(STDIN_FILENO, &rset); 


从 Select 返回 时 ， 可 以 用 FD_ISSET 测 试 该 集中 的 一 个 给 定位 是 否 仍 
处 于 打开 状态 : 
if (FD_ISSET(fd, &rset)) { 


} 

select 的 中 间 3 个 参数 《〈 指 同 描 述 符 集 的 指针 ) 中 的 任意 一 个 (或 全 
HB) 可 以 是 空 指针 ， 这 表示 对 相应 条 件 并 不 关心 。 如 果 所 有 3 个 指针 都 
是 NULL， 则 select 提 供 了 比 sleep 更 精确 的 定时 器 。【〔 回 忆 10.19 节 ， 
Sleep 等 待 整 数秒 ， 而 select 的 等 待 时 间 则 可 以 小 于 1 秒 ， 其 实际 精度 取决 
于 系统 时 钟 。) 习题 14.5 给 出 了 这 样 一 个 函数 。 

select 第 一 个 参数 maxfdp1 的 意思 是 “最 大 文件 描述 符 编 号 值 加 1。 
考虑 所 有 3 个 摘 述 符 集 ， 在 3 个 描述 符 集 中 找 出 最 大 摘 述 符 编号 值 ， 然 后 
加 1， 这 就 是 第 一 个 参数 值 。 也 可 将 第 一 个 参数 设置 为 FD_SETSIZE， 这 
是 <sys/select.h> 中 的 一 个 常量 ， 它 指定 最 大 描述 符 数 经常 是 1 024) ， 
但 是 对 大 多 数 应 用 程序 而 言 ， 此 值 太 大 了 。 确 实 ， 大 多 数 应 用 程序 只 使 
用 3 一 10 个 摘 述 符 《〈 某 些 应 用 程序 需要 更 多 的 摘 述 符 ， 但 这 种 UNIX 程 序 
并 不 典型 ) 。 通 过 指定 我 们 所 关注 的 最 大 描述 符 ， 内 核 就 只 需 在 此 范围 
内 寻找 打开 的 位 ， 而 不 必 在 3 个 描述 符 集 中 的 数 百 个 没有 使 用 的 位 内 搜 

例如 ， 图 14-16 所 示 的 两 个 描述 符 集 的 情况 就 好 像 是 执行 了 下 述 操 
作 : 

fd_set readset, writeset; 

FD_ZERO(&readset); 

FD_ZERO(&writeset); 

FD_SET(0, &readset); 

FD_SET(3, &readset); 

FD_SET(1, &writeset); 

FD_SET(2, &writeset); 

select(4, &readset, &writeset, NULL, NULL); 

因为 摘 述 符 编 号 从 0 开始 ， 所 以 要 在 最 大 摘 述 符 编 号 值 上 加 1。 第 一 
个 参数 实际 上 是 要 检查 的 描述 符 数 〈 从 摘 述 符 0 开 始 ) 。 

select 有 3 个 可 能 的 返回 值 。 
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图 14-16 select 的 样本 描述 符 集 

(1) 返回 值 -1 表示 出 错 。 这 是 可 能 发 生 的 ， 例 如 ， 在 所 指定 的 描 
A TR een” tenes 
不 修改 。 

(2) 返回 值 0 表示 没有 描述 符 准 备 好 。 寿 指定 的 描述 符 一 个 都 没准 
备 好 ， 指 定 的 时 间 就 过 了 ， 那 么 就 会 发 生 这 种 情况 。 此 时 ， 所 有 描述 符 
集 都 会 置 0。 

(3) 一 个 正 返 回 值 说 明了 已 经 准备 好 的 描述 符 数 。 该 值 是 3 个 描述 
符 集 中 已 准备 好 的 描述 符 数 之 和 ， 所 以 如 果 同 一 描述 符 已 准备 好 读 和 
写 ， 那 么 在 返回 值 中 会 对 其 计 两 次 数 。 在 这 种 情况 下 ， 3 个 描述 符 集 中 
仍旧 打开 的 位 对 应 于 已 准备 好 的 描述 符 。 

对 于 “准备 好 ”的 含义 要 作 一 些 更 具体 的 说 明 。 

oA MISE (readfds) 中 的 一 个 摘 述 符 进 行 的 read 操 作 不 会 月 寨 ， 则 
认为 此 描述 符 是 准备 好 的 。 

AM SE (writefds 〉 中 的 一 个 揪 述 符 进 行 的 write 操 作 不 会 阻塞 ， 
则 认为 此 摘 述 符 是 准备 好 的 。 

* 若 对 异常 条 件 集 (exceptfds) 中 的 一 个 描述 符 有 一 个 未 决 异 稼 条 
件 ， 则 认为 此 描述 符 是 准备 好 的 。 现 在 ， 异 常 条 件 包 括 : 在 网 络 连接 上 
到 达 带 外 的 数据 ， 或 者 在 处 于 数据 包 模 式 的 伪 终 端 上 发 生 了 某 些 条 件 。 
(Stevens[1990] 的 15.10 节 中 描述 了 后 一 种 条 件 。) 

* 对 于 读 、 写 和 异常 条 件 ， 普 通 文件 的 文件 摘 述 符 总 是 返回 准备 
村: 
一 个 描述 符 阻 塞 与 否 并 不 影响 select 是 否 阻塞 ， 理 解 这 一 点 很 重 











要 。 也 就 是 说 ， 如 果 希 望 读 一 个 非 阻 塞 捅 述 符 ， 并 且 以 超时 值 为 5 秒 调 
用 select， 则 select 最 多 阻塞 5 s。 相 类 似 ， 如 果 指 定 一 个 无 限 的 超时 值 ， 
则 在 该 描述 符 数 据 准 备 好 ， 或 捕捉 到 一 个 信号 之 前 ，select 会 一 直 阻 
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可 恋 的 。 然 后 调用 read， 它 返回 0， 这 是 UNIX 系 统 指示 到 达 文 件 尾 端的 
方法 。【〔 很 多 人 错误 地 认为 ， 当 到 达 文 件 尾 端 时 ， ”select 会 指示 一 个 异 
常 条 件 。) 
POSIX.1 也 定义 了 一 个 select 的 变 体 ， 称 为 pselect。 
#include <sys/select.h> 
int pselect(int maxfdp1, fd_set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 
const struct timespec *restrict tsptr, 
const sigset_t *restrict sigmask); 
返回 值 : 准备 就 绪 的 描述 符 数 目 ， 知 超时 ， 返 回 0; rote, e- 
除 下 列 几 点 外 ，pselect 与 Select 相同 。 
“select 的 超时 值 用 timeval 结 构 指定 ， 但 pselect 使 用 timespec 结 构 〈 回 
忆 4.2 节 中 timespec 结 构 的 定义 ) 。timespec 结 构 以 秒 和 纳 秒表 示 超 时 
值 ， 而 非 秒 和 微 秒 。 如 果 平 台 文 持 这 样 的 时 间 精 度 ， 那 么 timespec 吏 能 
提供 更 精准 的 超时 时 间 。 
pselect 的 超时 值 被 声明 为 const， 这 保证 了 调用 pselect 不 会 改变 此 
值 。 
epselect 可 使 用 可 选 信号 屏 珊 字 。 知 sigmask 为 NULL, MALESIA 
号 有 关 的 方面 ， pselect 的 运行 状况 和 select 相同 。 否 则 ，sigmask 指 问 
一 信号 屏蔽 字 ， 在 调用 pselect 时 ， 以 原子 操作 的 方式 安装 该 信号 屏蔽 
字 。 在 返回 时 ， 恢 复 以 前 的 信号 屏蔽 字 。 


14.4.2 函数 poll 


pol 函数 类 似 于 select， 但 是 程序 员 接口 有 所 不 同 。 昌 然 poll 函 数 是 
System V 引 入 进来 文 持 STREAMS 子 系统 的 ， 但 是 poll 函 数 可 用 于 任何 类 
型 的 文件 描述 符 。 

#include <poll.h> 

int poll(struct pollfd fdarray[], nfds_t nfds, int timeout); 

返回 值 : 准备 就 绪 的 描述 符 数 目 ， 寿 超时 ， 返 回 0; 奋 出 错 ， 返 回 -1 

与 select 不 同 ，poll 丰 是 为 每 个 条 件 〈( 可 读 性 、 可 写 性 和 异常 条 件 ) 
构造 一 个 描述 符 集 ， 而 是 构造 一 个 pollfd 结 构 的 数组 ， 每 个 数组 元 素 指 











定 一 个 描述 符 编号 以 及 我 们 对 该 描述 符 感 兴趣 的 条 件 。 
struct pollfd { 
int fd; /* file descriptor to check, or < 0 to ignore */ 
short events; /* events of interest on fd */ 
short revents; /* events that occurred on fd */ 


ie 

fdarray 数 组 中 的 元 素数 由 nfds 指 定 。 

由 于 历史 原因 ， 在 如 何 声 明 nfd 参数 方面 有 几 种 不 同 的 方式 。 
SVR3 将 nfds 的 类 型 指定 为 unsigned long， 这 似乎 是 太 大 了 。 在 SVR4 手 
有 册 [AT&T 1990d] 中 ，poll 原 型 的 第 二 个 参数 的 数据 类 型 为 size_t( 见 图 2- 
21 中 的 基本 系统 数据 类 型 )。 但 在 <poll.h> 包 含 的 实际 原型 中 ， 第 二 个 
参数 的 数据 类 型 仍 指定 为 unsigned long。Single UNIX Specification 定 义 
了 新 类 型 nfds tf， 该 类 型 允许 实现 选择 对 其 合适 的 类 型 并 且 隐 藏 了 应 用 
细节 。 注 意 ， 因 为 返回 值 表 示 数 组 中 满足 事件 的 项 数 ， 所 以 这 种 类 型 必 
须 大 得 足以 保存 一 个 整数 。 

对 应 于 SVR4 的 SVID[AT&T 1989] 上 显示 ，poll 的 第 一 个 参数 是 
struct pollfd fdarray[]， 而 SVR4 手 册页 [AT&T 1990d] 上 则 显示 该 参数 为 
struct pollfd*fdarray。 在 C 语 言 中 ， 这 两 种 声明 是 等 价 的 。 我 们 使 用 第 一 
ds i ee 而 不 是 指 同 单个 结构 
和 指针 。 

应 将 每 个 数组 元 素 的 events 成 员 设 置 为 图 14-17 中 所 示 值 的 一 个 或 几 
个 ， 通 过 这 些 值 告诉 内 核 我 们 关心 的 是 每 个 摘 述 符 的 哪些 事件 。 返 回 
时 ，revents ”成 员 由 内 核 设置 ， 用 于 说 明 每 个 描述 符 发 生 了 哪些 事件 。 
(注意 ，poll 没 有 更 改 events 成 员 。 这 与 select 不 同 ，select 修 改 其 参数 以 
指示 哪 一 个 描述 符 已 准备 好 了 。) 

图 14-17 中 的 前 4 行 测试 的 是 可 读 性 ， 接 下 来 的 3 行 测试 的 是 可 写 
性 ， 最 后 3 行 测试 的 是 异常 条 件 。 最 后 3 行 是 由 内 核 在 返回 时 设置 的 。 即 
使 在 events 字 段 中 没有 指定 这 3 个 值 ， 如 果 相 应 条 件 发 生 ， 在 revents 中 也 
会 返回 它们 。 

有 些 poll 事 件 的 名 字 中 包含 BAND， 它 指 的 是 STREAMS 当 中 的 优先 
级 波段 。 想 要 了 解 关 于 STREAMS 和 优先 级 波段 的 更 多 信息 ， 可 以 查看 
Rago[1993]. 




















人 events RA? T 


POLLIN 可 以 不 阻塞 地 读 高 优先 级 数据 以 外 的 数 
据 ( 等 效 于 POLLRDNORM| POLLRDBAND) 
可 以 不 阻 罕 地 读 普 通 数 据 

可 以 不 阻 宕 地 读 优先 级 娄 据 

可 以 不 阻塞 地 读 高 优先 级 数据 


POLLRDNORM 
POLLRDBAND 
POLLPRI 











POLLWRBAND 
POLLERR 
POLLHUP 
POLLNVAL 


可 以 不 阻 守 地 写 优 先 级 数据 


CHEN 
RHR- NIEH 
图 14-17 poll 的 events 和 revents 标 志 

当 一 个 描述 符 被 挂 断 (POLLHUP) 后 ， 就 不 能 再 写 该 描述 符 ， 但 
是 有 可 能 仍然 可 以 从 该 描述 符 读 取 到 数据 。 

poll 的 最 后 一 个 参数 指定 的 是 我 们 愿意 等 待 多 长 时 间 。 如 同 select 一 
样 ， 有 3 种 不 同 的 情形 。 

timeout == -1 

永远 等 待 。( 某 些 系统 在 <stropts.h> 中 定义 了 常量 INFTIM， 其 值 通 
党 是 -1。) 当 所 指定 的 描述 符 中 的 一 个 已 准备 好 ， 或 捕捉 到 一 个 信号 时 
返回 。 如 果 捕 捉 到 一 个 信号 ， 则 poll 返 回 -1，errno 设 置 为 EINTR。 

timeout == 0 

不 等 待 。 测 试 所 有 描述 符 并 立即 返回 。 这 是 一 种 轮 询 系统 的 方法 ， 
可 以 找到 多 个 描述 符 的 状态 而 不 阻塞 poll 函 数 。 

timeout > 0 

等 待 timeout 坚 秒 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 timeout 到 期 时 
立即 返回 。 如 果 timeout 到 期 时 还 没有 一 个 描述 符 准 备 好 ， 则 返回 值 是 
7 RRR REPR. Mi timeout ERE ERA 

| 
理解 文件 尾 端 与 挂 断 之 间 的 区 别 是 很 重要 的 。 如 果 我 们 正 从 终端 输 











POLLOUT 可 以 不 阻塞 地 与 普通 数据 
POLLWRNORM 5 POLLOUT 相同 











入 数据 ， 并 键入 文件 结束 符 ， 那 么 就 会 打开 POLLIN， 于 是 我 们 就 可 以 
读 文 件 结束 指示 (read 返 回 0) 。revents 中 的 POLLHUP 没 有 打开 。 如 果 
正在 读 调 制 解 调 器 ， 并 且 电 话 线 已 挂 断 ， 我 们 将 接 到 POLLHUP 通 知 。 

与 Select 一 样 ， 一 个 描述 符 是 否 阻塞 不 会 影响 pol 是 否 阻 塞 。 

select 和 poll 的 可 中 上 断 性 

中 断 的 系统 调用 的 自动 重启 是 由 4.2BSD 引 入 的 〈 见 10.5 节 ) ， 但 当 
时 select 函 数 是 不 重启 的 。 这 种 特性 在 大 多 数 系 统 中 一 直 延 续 了 下 来 ， 
即使 指定 了 SA_RESTART 选 项 也 是 如 此 。 但 是 ， 在 SYVR4 上 ， 如 果 指 定 
了 SA_RESTART， 那 么 select 和 poll 也 是 自动 重启 的 。 为 了 在 将 软件 移植 
到 SVR4 派 生 的 系统 上 时 阻止 这 一 点 ， 如 果 信 号 有 可 能 会 中 断 select 或 
poll， 就 要 使 用 signal_intr 函 数 〈 见 图 10-19) 。 

本 书 说 明 的 各 种 实现 在 接 到 一 信号 时 都 不 重启 动 poll 和 select， 即 便 
使 用 了 SA_RESTART 标 志 也 是 如 此 。 





14.5 #770 


使 用 上 一 节 说 明 的 select 和 pol 可 以 实现 异步 形式 的 通知 。 关 于 描述 
符 的 状态 ， 系 统 并 不 主动 告诉 我 们 任何 信息 ， 我 们 需要 进行 查询 〈 调 用 
select 或 poll) 。 如 在 第 10 章 中 所 述 ， 信 号 机 构 提 供 了 一 种 以 异步 形式 通 
知 某 种 事件 已 发 生 的 方法 。 由 BSD 和 System V 派 生 的 所 有 系统 都 提供 了 
某 种 形式 的 异步 JO， 使 用 一 个 信号 〈 在 System ”V 中 是 SIGPOLL,， 在 
BSD 中 是 SIGIO ) 通知 进程 ， 对 某 个 摘 述 符 所 关心 的 某 个 事件 已 经 发 
生 。 我 们 在 前 面 的 章节 中 提 到 过 ， 这 些 形 式 的 异步 JO 是 受 限 制 的 : 它 
们 并 不 能 用 在 所 有 的 文件 类 型 上 ， 而 且 只 能 使 用 一 个 信号 。 如 果 要 对 一 
个 以 上 的 描述 符 进 行 异步 LO， 那么 在 进程 接收 到 该 信号 时 并 不 知道 这 
一 信号 对 应 于 哪 一 个 描述 符 。 

SUSv4 中 将 通用 的 异步 JO 机 制 从 实时 扩展 部 分 调整 到 基本 规范 部 
分 。 这 种 机 制 解 决 了 这 些 陈旧 的 异步 1/O 设 施 存 在 的 局 限 性 。 

在 我 们 了 解 使 用 异步 1/O 的 不 同方 法 之 前 ， 需 要 先 讨 论 一 下 成 本 。 
在 用 异步 WO 的 时 候 ， 要 通过 选择 来 灵活 处 理 多 个 并 发 操作 ， 这 会 使 应 
用 程序 的 设计 复杂 化 。 更 简单 的 做 法 可 能 是 使 用 多 线程 ， 使 用 同步 模型 
来 编写 程序 ， 并 让 这 些 线程 以 异步 的 方式 运行 。 

使 用 POSIX 异 步 1/O 接 口 ， 会 带 来 下 列 麻烦 。 

“每 个 异步 操作 有 3 处 可 能 产生 错误 的 地 方 : 一 处 在 操作 提交 的 部 
ee 


“与 POSIX 异 步 /O 接 口 的 传统 方法 相 比 ， 它 们 本 身 涉及 大 量 的 额外 
设置 和 人 处理 规 则 。 

事实 上 ， 并 不 能 把 非 异步 WO 函数 称 作 “同步 的， 因为 尽管 它们 相 
对 于 程序 流 来 说 是 同步 的 ， 但 相对 于 WO 来 说 并 非 如 此 。 回 忆 第 3 章 中 关 
于 同步 写 的 讨论 。 当 从 write 函 数 的 调用 返回 时 ， 写 的 数据 是 持久 的 ， 我 
们 称 这 个 写 操作 为 “同步 的。 也 不 能 依靠 把 传统 的 调用 归 类 为 “标准 ”的 
WO 调用 来 区 别传 统 的 VO 函数 和 异步 1O 函 数 ， 因 为 这 样 会 使 它们 和 标准 
IO 库 中 的 函数 调用 相 混 请 。 为 了 避免 产生 这 种 混淆 ， 本 节 中 我 们 把 read 
和 write 函数 归 类 为 “传统 ”的 IO 困 数 。 

。 从 错误 中 恢复 可 能 会 比较 困难 。 举 例 来 说 ， 如 果 提 交 了 多 个 异步 
写 操作 ， 其 中 一 个 失败 了 ， 下 一 步 我 们 应 该 怎么 做 ? 如 果 这 些 写 操作 是 
相关 的 ， 那 么 可 能 还 需要 撤销 所 有 成 功 的 写 操作 。 




















14.5.1 System V7 1/O 


在 System Vi, 3 ”JIJO 是 STREAMS 系 统 的 一 部 分 ， 它 只 对 
STREAMS 设 备 和 STREAMS 管 道 起 作用 。System ”V 的 异步 /O 信 号 是 
SIGPOLL. 

为 了 对 一 个 STREAMS 设 备 启 动 异 步 JO， 需 要 调用 ioctl， 将 它 的 第 
二 个 参数 (request) 设置 成 L SETSIG。 第 三 个 参数 是 由 图 14-18 中 的 一 
个 或 多 个 常量 构成 的 整 型 值 。 这 些 常量 是 在 <stropts.h> 中 定义 的 。 

与 STREAMS 机 制 相 关 的 接口 在 SUSv4 中 已 被 标记 为 弃 用 ， 所 以 这 
里 不 讨论 它们 的 任何 细节 。 关于 STREAMS 的 信息 详 见 Rago[1993]。 

除了 调用 ioctl 指 定 产 生 SIGPOLL 信 号 的 条 件 以 外 ， 还 应 为 该 信号 建 

立信 号 处 理 程序 。 回 忆 图 10-1， 对 于 SIGPOLL 的 默认 动作 是 终止 该 进 
fi, 所 以 应 当 在 调用 ioctl 之 前 建立 信和 号 处 理 程 序 。 








S INPUT 可 以 不 阻塞 地 读 取 数据 〈 非 高 优先 级 数据 ) 

S_RDNORM 可 以 不 阻塞 地 读 取 普通 数据 

S_RDBAND 可 以 不 阻塞 地 读 取 优先 级 数据 

S BANDURG 大 此 常量 和 S RDBAND 一 起 指定 ， 当 我 们 可 以 不 阻塞 地 读 取 
优先 数据 时 ， 产 生 SIGURG 信号 而 非 SIGPOLL 


S HIPRI 可 以 不 阻塞 地 读 取 高 优先 级 数据 
S_OUTPUT 可 以 不 阻塞 地 写 普 通 数据 

S WRNORM 与 9 0UTPUT 相同 

S WRBAND 可 以 不 阻塞 地 写 优先 级 数据 

S_MSG 包含 SIGPOLL 信号 的 消息 已 经 到 达 流 头 部 
S_ERROR 流 有 错误 

S_HANGUP 流 已 挂 起 





图 14-18 产生 SIGPOLL 信 和 号 的 条 件 


14.5.2 BSD 异 步 O 


在 BSD 派 生 的 系统 中 ， 异 步 JO 是 信号 SIGIO 和 SIGURG 的 组 合 。 
SIGIO 是 通用 异步 IO 信号 ，SIGURG 则 只 用 来 通知 进程 网 络 连 接 上 的 带 
外 数据 已 经 到 达 。 

为 了 接收 SIGIO 信 号 ， 需 执行 以 下 3 步 。 

(1) 调用 signal 或 sigaction 为 SIGIO 信 号 建立 言 号 处 理 程 序 。 

(2) 以 命令 F_SETOWN ( 见 3.14 节 ) 调用 fcnt 来 设置 进程 ID 或 进 
程 组 ID， 用 于 接收 对 于 该 描述 符 的 信号。 

(3) 以 命令 F_SETFL 调 用 fcntl 设 置 O_ASYNC 文 件 状态 标志 ( 见 图 
3-10) ， 使 在 该 描述 符 上 可 以 进 和 J 异步 /0O。 

第 3 步 仅 能 对 指向 终 前 或 网 络 的 描述 符 执行 ， 这 是 BSD 异 步 JO 设 施 
的 一 个 基本 限制 。 

对 于 SIGURG 信 号 ， 只 需 执 行 第 1 步 和 第 2 步 。 该 信号 仅 对 引用 支持 
带 外 数据 的 网 络 连接 描述 符 而 产生 ， 如 TCP 连 接 。 


14.5.3 POSIX 寞 步 VO 


POSIX 异 步 WO 接 口 为 对 不 同类 型 的 文件 进行 异步 WO 提供 了 一 套 一 
致 的 方法 。 这 些 接口 来 自 实 时 草案 标准 ， 该 标准 是 Single UNIX 
Specification 的 可 选项 。 在 SUSv4 中 ， 这 些 接 口 被 移 到 了 基本 部 分 中 ， 所 
以 现在 所 有 的 平台 都 被 要 求 支持 这 些 接口 。 

这 些 异步 de aiocbZ SEX T 
AIO 控 制 块 。 该 结构 至 少 包括 下 面 这 些 字 段 (具体 的 实现 可 能 还 包含 有 
频 外 的 字段 ) i 


struct aiocb { 














int aio_fildes; /* file descriptor */ 

off t aio_offset; /* file offset for I/O */ 

volatile void *aio_buf; /* buffer for I/O */ 

size_t aio_nbytes; /* number of bytes to 
transfer */ 

int aio_reqprio; /* priority */ 

struct sigevent aio_sigevent; /* signal information */ 

int aio_lio_opcode; /* operation for list I/O 
*/ 
下 


aio_fields 字段 表示 被 打开 用 来 读 或 写 的 文件 摘 述 符 。 读 或 写 操 作 从 
aio_offset ”指定 的 偏 移 量 开始 。 对 于 读 操 作 ， 数 据 会 复制 到 缓冲 区 中 ， 
该 缓冲 区 从 aio_buf 指定 的 地 址 开始 。 对 于 写 操作 ， 数 据 会 从 这 个 缓冲 


区 中 复制 出 来 。aio_nbytes 字 段 包 含 了 要 读 或 写 的 字 节 数 。 

注意 ， 异 步 JO 操 作 必须 显 式 地 指定 侦 移 量 。 异 步 JO 接 口 并 不 影 啊 
由 操作 系统 维护 的 文件 偏 移 量 。 只 要 不 在 同一 个 进程 里 把 异步 WO 函数 
和 传统 IO 函数 混在 一 起 用 在 同一 个 文件 上 ， 残 不 会 导致 什么 问题 。 同 
时 值得 注意 的 是 ， 如 果 使 用 异步 IO 接口 向 一 个 以 追加 模式 〈 使 用 
O_APPEND) 打开 的 文件 中 写 入 数据 ，AIO 控 制 块 中 的 aio_offset 字 段 会 

其 他 字段 和 传统 MO 函数 中 的 不 一 致 。 应 用 程序 使 用 aio_reqprio 字 段 
为 异步 IO 请 求 提 示 顺 序 。 然 而 ， 系 统 对 于 该 顺序 只 有 有 限 的 控制 能 
力 ， 因 此 不 一 定 能 遵循 该 提示 。aio_lio_opcode 字 段 只 能 用 于 基于 列表 的 
异步 0， 我 们 在 稍 后 再 讨论 它 。aio_sigevent 字 段 控制 ， 在 IO 事件 完成 
后 ， 如 何 通 知 应 用 程序 。 这 个 字段 通过 sigevent 结 构 来 描述 。 


struct sigevent { 




















int sigev_notify; lk 
notify type */ 

int sigev_signo; ‘ns 
signal number */ 

union sigval sigev_value; /* notify 
argument */ 

void (*sigev_notify_function)(union sigval); /* notify 
function */ 

pthread_attr_t *sigev_notify_attributes; /* notify 
attrs */ 


}; 
sigev_notify 字 段 控 制 通知 的 类 型 。 取 值 可 能 是 以 下 3 个 中 的 一 个 。 

SIGEV_NONE 异步 IO 请 求 完 成 后 ， 不 通知 进程 。 

SIGEV_SIGNAL 异步 IO 请 求 完 成 后 ， 产 生 由 sigev_signo 字 段 指 定 
的 信号 。 如 果 应 用 程序 已 选择 捕捉 信号 ， 且 在 建立 信号 处 理 程序 的 时 候 
指定 了 SA_SIGINFO 标志 ， 那 么 该 信号 将 被 入 队 《〈 如 果实 现 支 持 排队 
信号 ) 。 信 和 号 处 理 程 序 会 传送 给 一 个 siginfo 结 构 ， 该 结构 的 si_value 字 段 
被 设置 为 sigev_value 〈 如 果 使 用 了 SA_SIGINFO 标 志 ) 。 

SIGEV_THREAD 当 异 步 JO 请 求 完 成 时 ， 由 sigev_notify_function 字 
段 指定 的 函数 被 调用 。sigev_value 字 段 被 传 入 作为 它 的 唯一 参数 。 除 非 
sigev_notify_attributes 字段 被 设 定 为 pthread 属性 结构 的 地 址 ， 且 该 结构 
指定 了 一 个 另外 的 线程 属性 ， 否 则 该 函数 将 在 分 离 状态 下 的 一 个 单独 的 
线程 中 执行 。 

在 进行 异步 IO 之 前 需要 先 初始 化 AIO 控 制 块 ， 调 用 aio_read 函 数 来 




















进行 异步 读 操作 ， 或 调用 aio_write 函 数 来 进行 异步 写 操作 。 

#include <aio.h> 

int aio_read(struct aiocb *aiocb); 

int aio_write(struct aiocb *aiocb); 

PAT PRAIRIE: 知 成 功 ， 返 回 0; 大 出 错 ， 返 回 -1 

当 这 些 函 数 返回 成 功 时 ， 异 步 JO 请 求 便 已 经 被 操作 系统 放 入 等 待 
处 理 的 队列 中 了 。 这 些 返回 值 与 实际 IO 操作 的 结果 没有 任何 关系 。LIO 
操作 在 等 竺 时， 必须 注意 确保 AIO 控 制 块 和 数据 库 绥 冲 区 保持 稳定 ; 它 
人 内 存 必须 始终 是 合法 的 ， 除 非 VO 操 作 完 成 ， 否 则 不 能 被 

用 


要 想 强 制 所 有 等 待 中 的 异步 操作 不 等 竺 而 写 入 持久 化 的 存储 中 ， 可 
以 设立 一 个 AIO 控制 块 并 调用 aio_fsync 函 数 。 

#include <aio.h> 

int aio_fsync(int op, struct aiocb *aiocb); 

返回 值 : ERJ, WO; 大 出 错 ， 返 回 -1 

AIO 控 制 块 中 的 aio_fildes 字 段 指定 了 其 异步 写 操作 被 同步 的 文件 。 
如 采 op 参 数 设 定 为 0 DSYNC， 那 么 操作 执行 起 来 就 会 像 调 用 了 
fdatasync 一 样 。 人 否则 ， 如 果 op 参 数 设 定 为 0 SYNC， 那 么 操作 执行 起 来 
就 会 像 调 用 了 fsync 一 样 。 

像 aio_read 和 aio_write 函 数 一 样 ， 在 安排 了 同步 时 ，aio_fsync 操 作 返 
回 。 在 异步 同步 操作 完成 之 前 ， 数 据 不 会 被 持久 化 。AIO 控制 块 控制 我 
们 如 何 被 通知 ， 就 像 aio_read 和 aio_write 函 数 一 样 。 

为 了 获知 一 个 噶 步 谈 、 写 或 者 同步 操作 的 完成 状态 ， 需 要 调用 
aio_error 函 数 。 

#include <aio.h> 

int aio_error(const struct aiocb *aiocb); 


返回 值 : ILF) 
返回 值 为 下 面 4 种 情况 中 的 一 种 。 
0 异步 操作 成 功 完成 。 需 要 调用 aio_retur 函 数 获取 操作 返回 值 。 
对 aio_error 的 调用 失败 。 这 种 情况 下 ，errno 会 告诉 我 们 为 什么 。-1 
EINPROGRESS 异步 读 、 写 或 同步 操作 仍 在 等 待 。 
其 他 情况 其 他 任何 返回 值 是 相关 的 异步 操作 失败 返回 的 错误 人 码 。 
i 如 果 异 步 操 作成 功 ， 可 以 调用 aio_retum 函 数 来 获取 异步 操作 的 返回 
#include <aio.h> 
ssize_t aio_return(const struct aiocb *aiocb); 








返回 值 : 〈 见 下 ) 


直到 异步 操作 完成 之 前 ， 都 需要 小 心 不 要 调用 aio_return 冰 数 。 操 作 
完成 之 前 的 结果 是 未 定义 的 。 还 需要 小 心 对 每 个 异步 操作 只 调用 一 次 
aio_return。 一 旦 调用 了 该 函数 ， 操 作 系 统 就 可 以 释放 掉包 含 了 LO 操作 
返回 值 的 记录 。 

如 采 aio_return 函 数 本 身 失 败 ， 会 返回 -1， 并 设置 errno。 其 他 情况 
下 ， 它 将 返回 异步 操作 的 结果 ， 即 会 返回 read、write 或 者 fsync 在 被 成 功 
调用 时 可 能 返回 的 结果 。 

执行 O 操 作 时 ， 如 果 还 有 其 他 事务 要 处 理 而 不 想 被 TO 操作 阻塞 ， 
就 可 以 使 用 异步 WO。 然 而 ， 如 果 在 完成 了 所 有 事务 时 ， 还 有 异步 操作 
未 完成 时 ， 可 以 调用 aio_suspend 函 数 来 阻塞 进程 ， 直 到 操作 完成 。 

#include <aio.h> 

int aio_suspend(const struct aiocb *const list[], int nent, 

const struct timespec *timeout); 
BREE: AA, IO; 奎 出 错 ， 返 回 -1 

aio_suspend 可 能 会 返回 三 种 情况 中 的 一 种 。 如 果 我 们 被 一 个 信号 中 
斯 ， 它 将 会 返回 -1， 并 将 errno 设 置 为 EFINTR。 如 采 在 没有 任何 IO 操作 
完成 的 情况 下 ， 阻 塞 的 时 间 超 过 了 函数 中 可 选 的 timeout 参数 所 指定 的 
时 间 限 制 ， 那 么 aio_suspend 将 返回 -1， 并 将 erno 设置 为 EAGAIN (不 
想 设置 任何 时 间 限 制 的话 ， 可 以 把 空 指针 传 给 timeout 参 数 ) 。 如 果 有 任 
何 IO 操 作 完 成 ，aio_suspend 将 返回 0。 如 果 在 我 们 调用 aio_suspend 操 作 
时 ， 所 有 的 异步 VO 操 作 都 已 完成 ， 那 么 aio_suspend 将 在 不 阻塞 的 情况 
下 直接 返回 。 

list 参 数 是 一 个 指向 AIO 控 制 块 数组 的 指针 ，nent 参 数 表 明了 数组 中 
的 条 目 数 。 数 组 中 的 空 指 针 会 被 跳 过 ， 其 他 条 目 都 必须 指向 已 用 于 初始 
化 异步 WO 操作 的 AIO 控 制 块 。 

当 还 有 我 们 不 想 再 完成 的 等 竺 中 的 异步 /1O 操 作 时 ， 可 以 尝试 使 用 
aio_cancel 函 数 来 取消 它们 。 

#include <aio.h> 

int aio_cancel(int fd, struct aiocb *aiocb); 

BEHE: ILF) 

fd 参数 指定 了 那个 未 完成 的 异步 IO 操作 的 文件 描述 符 。 如 果 aiocb 
参数 为 NULL， 系 统 将 会 尝试 取消 所有 该 文件 上 未 完成 的 异步 WO 操作 。 
其 他 情况 下 ， 系 统 将 尝试 取消 由 AIO 控 制 块 描述 的 单个 异步 WO 操作 。 我 
们 之 所 以 说 系统 “尝试 "取消 操作 ， 是 因为 无 法 保证 系统 能 够 取消 正在 进 
程 中 的 任何 操作 。 

aio_cancel 函 数 可 能 会 返回 以 下 4 个 值 中 的 一 个 。 

AIO_ALLDONE 所 有 操作 在 尝试 取消 它们 之 前 已 经 完成 








AIO_CANCELED 所 有 要 求 的 操作 已 被 取消 。 

AIO_NOTCANCELED 至 少 有 一 个 要 求 的 操作 没有 被 取消 。 

-1 对 aio_cancel 的 调用 失败 ， 错 误 人 码 将 被 存储 在 errno 中 。 

如 果 异 步 IO 操 作 被 成 功 取 消 ， 对 相应 的 AIO 控 制 块 调用 aio_error 画 
数 将 会 返回 错误 ECANCELED。 如 果 操 作 不 能 被 取消 ， 那 么 相应 的 AIO 
控制 块 不 会 因为 对 aio_cancel 的 调用 而 被 修改 。 

还 有 一 个 函数 也 被 包含 在 异步 IO 接口 当中 ， 尽 管 它 既 能 以 同步 的 
方式 来 使 用 ， 又 能 以 异步 的 方 

式 来 使 用 ， 这 个 函数 就 是 lio_ listio。 该 函数 提交 一 系列 由 一 个 AIO 
控制 块 列表 描述 的 MO 请 求 。 

#include <aio.h> 

int lio_listio(int mode, struct aiocb *restrict const list[restrict], 

int nent, struct sigevent *restrict sigev); 
返回 值 : ERHI, Belo; 若 出 错 ， 返 回 -1 

mode 参 数 决 定 了 1/O 是 否 真 的 是 异步 的 。 如 果 访 参数 被 设 定 为 
LIO_WAIT，lio_listio 函 数 将 在 所 有 由 列表 指定 的 IO 操作 完成 后 返回 。 
在 这 种 情况 下 ，sigev 参 数 将 被 忽略 。 如 果 mode 参 数 被 设 定 为 
LIO_NOWAIT，lio_listio 函 数 将 在 IO 请 求 入 队 后 立即 返回 。 进 程 将 在 所 
有 IO 操作 完成 后 ， 按 照 sigev 参 数 指定 的 ， 被 异步 地 通知 。 如 果 不 想 被 
通知 ， 可 以 把 sigev 设 定 为 NULL。 注 意 ， 每 个 AIO 控 制 块 本 身 也 可 能 启 
用 了 在 各 自 操 作 完 成 时 的 异步 通知 。 被 sigev 参 数 指定 的 异步 通知 是 在 此 
之 外 另 加 的 ， 并 且 只 会 在 所 有 的 IO 操作 完成 后 发 送 。 

list 参 数 指向 AIO 控 制 块 列表 ， 该 列表 指定 了 要 运行 的 MO 操作 的 。 
nent 参 数 指定 了 数组 中 的 元 素 个 数 。AIO 控 制 块 列表 可 以 包含 NULL 指 
针 ， 这 些 条 目 将 被 忽略 。 

在 每 一 个 AIO 控 制 块 中 ，aio_lio_opcode 字 段 指定 了 该 操作 是 一 个 读 
操作 (LIO_READ) 、 写 操作 (LIO_WRITE) ， 还 是 将 被 忽略 的 空 操 
YE (LIO_NOP) 。 读 操作 会 按照 对 应 的 AIO 控制 块 被 传 给 了 aio_read 函 
数 来 处 理 。 类 似 地 ， 写 操作 会 按照 对 应 的 AIO 控 制 块 被 传 给 了 aio_write 
函数 来 处 理 。 

实现 会 限制 我 们 不 想 完 成 的 异步 VO 操作 的 数量 。 这 些 限 制 都 是 运 
行 时 不 变量 ， 其 总 结 如 图 14-19 所 示 。 

可 以 通过 调用 sysconf 函数 并 把 name 参数 设置 为 
_SC_IO_LISTIO_ MAX 来 设 定 AIO_LISTIO_MAX 的 值 。 类 似 地 ， 可 以 
通过 调用 sysconf 并 把 name 人 参数 设置 为 SC_AIO_MAX 来 设 定 AIO_MAX 
的 值 ， 通 过 调用 sysconf 并 把 其 参数 设置 为 
_SC_AIO_PRIO_DELTA_MAX 来 设 定 AIO_PRIO_DELTA_MAX 的 值 。 














AIO LISTIO MAX 单个 列表 VO 调用 中 的 最 大 O 操作 数 POSIX AIO LISTIO MAX (2) 


AIO MAX 未 完成 的 异步 VO 操作 的 最 大 数 晶 POSIX AIO MAX (1) 
AIO PRIO DELTA MAX | 进程 可 以 减少 的 其 异步 VO 优先 级 的 最 大 值 

















图 14-19 POSIX.1 中 的 异步 WO 运行 时 不 变量 的 值 

引入 POSIX 异 步 操 作 1O 接 口 的 初衷 是 为 实时 应 用 提供 一 种 方法 ， 
避免 在 执行 VO 操作 时 阻塞 进程 。 接 下 来 就 让 我 们 来 看 一 个 使 用 这 些 接 
口 的 例子 。 

实例 

虽然 我 们 不 会 在 本 文中 讨论 实时 编程 ， 但 因为 POSIX 异步 VO fe 
口 现 在 是 Single UNIX Specification 的 基本 部 分 ， 所 以 我 们 要 了 解 一 下 怎 
么 使 用 它们 。 为 了 对 比 异 步 JO 接 口 和 相应 的 传统 IO 接口 ， 我 们 来 研究 
一 个 任务 ， 将 一 个 文件 从 一 种 格式 翻译 成 另 一 种 格式 。 

图 14-20 中 展示 的 程序 ， 使 用 20 世 纪 80 年 代 流 行 的 USENET 新 闻 系 统 
中 使 用 的 ROT-13 算 法 ， 翻 译文 件 ， 该 算法 原本 用 于 将 文本 中 的 带 有 侵 
犯 性 的 或 者 含有 剧 透 和 笑话 笑 点 部 分 的 文本 模糊 化 。 访 算法 将 文本 中 的 
英文 字符 a 一 z 和 A 一 Z 分 别 循环 同 右 但 移 13 个 字母 位 移 ， 但 不 改变 其 他 


Po AY 


To 





finclude "apue ,hn 
#include <ctype,h> 
finclude <fentl.h> 


#define BSZ 4096 


unsigned char buf [BSZ]; 


unsigned char 


translate (unsigned char c) 


| 


if (isalpha(c)) | 


tt io pe 1) 
c -= 13; 

else if (c >= 'a') 
c t= 13; 

else if (c >= 'N') 
a == dos 

else 
c+ 133 


return (c); 


int 


main(int argc, char* argv[]) 


| 


int ifd, ofd, i, n, nw; 


if (argc != 3) 
err quit("usage: rotl3 infile outfile"); 

if ((ifd = open(argv{1], 0 RDONLY)) < 0) 
err sys("can't open 3s", argv[1]); 

if ((ofd = open(argv(2], O_RDWR|O_CREAT|O_TRUNC, FILE MODE)) < 0) 
err_sys("can't create 3s", argv(2]); 


while ((n = read(ifd, buf, BSZ)) > 0) { 
for (1 = 0; i< nj itt) 
buf[i] = translate (buf[i]); 
if ((nw = write(ofd, buf, n)) != n) { 
if (nw < 0) 
err sys("write failed"); 
else 
err quit ("short write ($d/%d)", nw, n); 


fsync (ofd) ; 
exit (0); 


图 14-20 用 ROT-13 翻 译 一 个 文件 
程序 中 的 IO 部 分 是 很 直接 的 : 从 输入 文件 中 读 取 一 个 块 ， 翻 译 
之 ， 然 后 再 把 这 个 块 写 到 输出 文件 中 。 重 复 该 步骤 直到 遇 到 文件 尾 端 ， 
图 14-21 中 的 程序 展示 了 如 何 使 用 等 价 的 异步 /0 函数 做 同样 
和 任务。 








#include "apue.h" 
finclude <ctype.h> 
tinclude <fcnt].h> 
#include <aio,h> 
tinclude <errno.h> 


#define BSZ 4096 
#define NBUF 8 


enum rwop { 
UNUSED = 0, 
READ PENDING = 1, 
WRITE PENDING = 2 


struct buf { 
enum rwop op; 
int last; 
struct aiocb aiocb; 
unsigned char data [BSZ]; 


struct buf bufs [NBUF]; 
unsigned char 
translate (unsigned char c) 


| 


/* same as before */ 


int 


main(int argc, char* argv[]) 


{ 


int red. cid, 2, Je i Ser, 
struct stat sbuf; 

const struct aiocb *aiolist [NBUF]; 

OFf t off = O; 

if (arge != 3) 


err_quit("usage: rot13 infile outfile"); 
if ((ifd = open(argv[1], O_RDONLY)) < 0) 
err sys ("can’t open %s", argv[1]); 


if ((ofd = open(argv[2], O_RDWR|O_CREAT|O_TRUNC, 


err_sys ("can’t create $s", argv[2]); 
if (fstat(ifd, &sbuf) < 0) 
err _ sys("fstat failed"); 


/* initialize the buffers */ 


for (i = O; i < NBUF; i++) f 
bufs[i].op = UNUSED; 
bufs[i]-aiocb.aio_ buf = bufs[i].data; 
bufs[i]-.aiocb.aio_sigevent.sigev_notify = 
aiolist[i] = NULL; 

} 

numop = 0; 

for (æ) i 


for (i = O; i < NBUF; i++) { 
switch (bufs[i]-.op) { 
case UNUSED: 
/* 


numop; 


FILE MODE)) < 0) 


SIGEV_NONE; 


* Read from the input file if more data 


* remains unread. 
ef 
if (off < sbuf.st_size) { 
bufs[i].op = READ PENDING; 


bufs[i].aiocb.aio fildes = ifd; 
bufs[i].aiocb.aio_offset = off; 


off += BSZ; 
if (off >= sbuf.st_size) 
bufs[i].last = 1; 


bufs[i]-aiocb.aio_nbytes = BSZ; 


if (aio_read(&bufs[i].aiocb) 


= Oy 


err sys ("aio read failed"); 


aiolist[i] = &bufs[i].aiocb; 
numop++; 
} 


break; 


Case READ PENDING: 


if ((err = aio error (&bufs[i].aiocb)) == 


continue; 
Re (CFF t= OF 4 


EINPROGRESS) 


if (err == -1) 
err _ sys("aio_error failed"); 


else 
err exit(err, "read failed"); 


/* 
* A read is complete; translate the buffer 
* and write it. 


eh 
if ((n = aio return (&bufs[i].aiocb)) < 0) 
err_sys("aio_return failed"); 
if (n != BSZ && !bufs[i]-last) 
Err Quit ("short read (a/a; T; n, BSZJF 
for ( = 03 3 <= ne JFE) 
bufs[i].data[j] = translate (bufs[i]-data[j]); 
bufs[i].op = WRITE_PENDING; 
bufs[i].aiocb.aio_fildes = ofd; 


bufs[i].aiocb.aio_nbytes rs 

if (aio_ write (&bufs[i].aiocb) < 0) 
err _ sys("aio_write failed"); 

/* retain our spot in aiolist */ 


break; 


case WRITE PENDING: 


if ((err = aio_error(&bufs[i]-.aiocb)) == EINPROGRESS) 
continue; 

if fern t= GC) f 
if (err == -1) 


err_sys("aio_error failed"); 


else 
err exit (err, “write failed"); 


/* 
* A write is complete; mark the buffer as unused. 
ad 
if ((n = aio_return(é&bufs[i].aiocb)) < 0) 
err_sys("aio_return failed"); 
if (n != bufs[i].aiocb.aio_nbytes) 
err _quit("short write (%d/%d)", n, BSZ); 
aiolist[{i] = NULL; 
bufs[i].op = UNUSED; 
numop-—; 
break; 
} 
} 
if (numop == 0) { 
if (off >= sbuf.st_size) 
break; 


} else { 
if (aio_suspend(aiolist, NBUF, NULL) < 0) 
err_sys("aio_suspend failed"); 


bufs[0] ,aiocb ,aio fildes = ofd; 

1f (alo fsync(0 SYNC, &bufs[0].alocb) < 0) 
err sys ("alo fsync failed"); 

exit (0); 








图 14-21 用 ROT-13 和 有 异步 IO 翻译 一 个 文件 
注意 ， 我 们 使 用 了 8 个 缓冲 区 ， 因 此 可 以 有 最 多 8 个 异步 1/O 请 求 处 

于 等 待 状态 。 令 人 惊讶 的 是 ， 实 际 上 这 可 能 会 降低 性 能 ， 因 为 如 果 读 操 

作 是 以 无 序 的 方式 提交 给 文件 系统 的 ， 操 作 系 统 提 前 读 的 算法 便 会 失 


效 。 

在 检查 操作 的 返回 值 之 前 ， 必 须 确 认 操 作 已 经 完成 。 当 aio_error 返 
回 的 值 既 非 EINPROGRESS 亦 非 -1 时 ， 表 明 操 作 完 成 。 除 了 这 些 值 之 
外 ， 如 果 返 回 值 是 0 以 外 的 任何 值 ， 说 明 操 作 失 败 了 。 一 旦 检查 过 这 些 
情况 ， 便 可 以 安全 地 调用 aio_return 来 获取 IO 操作 的 返回 值 了 。 

只 要 还 有 事情 要 人 做， 就 可 以 提交 异步 JO 操 作 。 当 存在 未 使 用 的 AIO 
控制 块 时 ， 可 以 提交 一 个 异步 读 操 作 。 读 操作 完成 后 ， 翻 译 缓冲 区 中 的 
内 容 并 将 它 提 交 给 一 个 异步 写 请 求 。 当 所 有 AIO 控 制 块 都 在 使 用 中 时 ， 
通过 调用 aio_suspend 等 待 操作 完成 。 

在 把 一 个 块 写 入 输出 文件 时 ， 我 们 保留 了 在 从 输入 文件 读 取 数据 时 
的 偏 移 量 。 因 而 写 的 顺序 并 不 重要 。 这 一 策略 仅 在 输入 文件 中 每 个 字符 
和 输出 文件 中 对 应 的 字符 的 偏 移 量 相 同 的 情况 下 适用 ， 我 们 在 输出 文件 
中 既 没 有 添加 字符 也 没有 删除 字符 。 

这 个 实例 中 并 没有 使 用 异步 通知 ， 因 为 使 用 同步 编程 模型 更 加 人 简 
单 。 如 果 在 IO 操作 进行 时 还 有 列 的 事情 要 做 ， 那 么 额外 的 工作 可 以 包 
含 在 for 循 环 当 中 。 然 而 ， 如 果 需 要 阻止 这 些 额 外 的 工作 延迟 翻译 文件 的 
任务 ， 那 么 就 需要 组 织 下 代码 使 用 异步 通知 。 多 任务 情况 下 ， 决 定 程 序 
如 何 建构 之 前 需要 先 考虑 各 个 任务 的 优先 级 。 

















14.6 困 数 readv 和 writev 


readv 和 writev 函 数 用 于 在 一 次 函数 调用 中 读 、 写 多 个 非 连续 缓冲 
区 。 有 时 也 将 这 两 个 函数 称 为 散布 谈 (scatter read) MRR (gather 
Write) 。 
#include <sys/uio.h> 
ssize_t readv(int fd, const struct iovec *iov, int iovcnt); 
ssize_t writev(int fd, const struct iovec *iov, int iovcnt); 
两 个 函数 的 返回 值 ， 已 读 或 已 写 的 字 节 数 ; A, Re- 
这 两 个 函数 的 第 二 个 参数 是 指向 iovec 结 构 数 组 的 一 个 指针 : 
struct iovec { 
void *iov_base; /* starting address of buffer */ 
size_t iov_len; /* size of buffer */ 


5 
iov 数 组 中 的 元 素数 由 iovcnt 指 定 ， 其 最 大 值 受 限于 IOV_MAX (El 
忆 图 2-11) 。 图 14-22 显 示 了 这 两 个 函数 的 参数 和 iovec 结 构 之 间 的 关 


wite 函数 从 缓冲 区 中 聚集 输出 数据 的 顺序 是 ，iovf0]、iov[ 了 J 直至 
iov[iovcnt-1]。writev 返 回 输出 的 字 节 总 数 ， 通 党 应 等 于 所 有 缓冲 区 长 度 


之 和 。 
iov[0].iov_ len | 长 度 (0 | 一 一 一 长 度 0 一 一 一 >| 


i0v[1] ,iov base 











缓冲 区 1 
| 一 长 度 1 一 >>| 


lov[tovcnt-1].iov_base 缓冲 区 N 


iov[iovcnt-1] ,iov len | 长 度 N | 一 一 一 长度 N 一 一 一 > 


iov[1] ,iov len | 长 度 1 








图 14-22 readv 和 writev 的 iovec 结 构 
readv i pte areal Sai 顺序 散布 到 缓冲 区 中 。readv 
总 是 先 填 满 一 个 缓冲 区 ， 然 后 再 填写 下 一 个 。readv 返 回 读 到 的 字 节 总 
数 。 如 果 遇 到 文件 尾 端 ， 已 无 数据 可 读 ， 则 运 回 0. 
这 两 个 函数 始 于 4.2BSD， 后 来 ，SVR4 也 提供 它们 。 在 Single UNIX 
Specification 的 XSI 扩 展 中 包括 了 这 两 个 函数 。 


实例 
在 20.8 节 的 _db_writeidx 函数 中 ， 需 将 两 个 缓冲 区 中 的 内 容 连 续 地 
写 到 一 个 文件 中 。 第 二 个 缓冲 区 是 调用 者 传递 过 来 的 一 个 参数 ， 第 一 个 
绥 冲 区 是 我 们 创建 的 ， 它 包含 了 第 二 个 绥 剖 的 长 度 以 及 文件 中 其他 信息 
的 文件 偏 移 量 以 下 3 种 方法 可 以 实现 这 一 要 求 。 
(1) 调用 两 次 write， 每 个 缓冲 区 一 次 。 
(2) 分 配 一 个 大 到 足以 包含 两 个 缓冲 区 的 新 缓冲 区 。 将 两 个 缓冲 
区 的 内 容 复 制 到 新 缓冲 区 中 。 然 后 对 这 个 新 缓冲 区 调用 一 次 write。 
(3) 调用 writev 输 出 两 个 缓冲 区 。 
20.8 节 的 解决 方案 使 用 了 writev， 但 是 将 它 与 另外 两 种 方法 进行 比 
较 ， 对 我 们 是 很 有 启发 的 。 图 14-23 显 示 了 上 面 所 述 3 种 方法 的 结果 。 

















Linux (Intel x86 ) Mac OS X (Intel x86) 


_" [ee e eee 


两 {K write 
缓冲 区 复制 然后 次 write 








次 writev 


























图 14-23 比较 writev 和 其 他 技术 所 得 的 时 间 结 果 
用 于 测量 的 测试 程序 输出 一 个 100 字 节 的 头 文件 ， 接 着 又 输出 200 字 
节 的 数据 。 这 样 做 1 048 576 次 ， 产 生 了 一 个 300 MB 的 文件 。 该 测试 程 
序 有 3 个 版 本 一 针对 图 14-23 中 的 每 一 种 测量 技术 编写 了 一 个 版 本 。 使 用 
times〈 见 8.17 节 ) 测 得 它们 在 写 操作 前 、 后 各 使 用 的 用 户 CPU 时 间 、 系 
统 CPU 时 间 和 时 钟 时 间 。 这 3 个 时 间 的 单位 都 是 秒 。 
正如 我 们 所 预料 的 ， 调 用 两 次 write 的 系统 时 间 比 调用 一 次 write 或 
writev 的 长 ， 这 与 图 3-6 的 结果 类 似 。 
接着 要 注意 的 是 ， 在 缓冲 区 复制 后 跟随 一 个 write 所 用 的 CPU 时 间 
《用 户 时 间 加 系统 时 间 ) 要 少 于 调用 一 次 writev 所 耗费 的 CPU 时 间 。 对 





于 单一 write 的 情况 ， 我 们 先 将 用 户 层次 的 两 个 缓冲 区 复制 到 一 个 分 段 组 
冲 区 (staging buffer) ， 然 后 在 调用 write 时 内 核 将 该 分 段 缓冲 区 中 的 数 
据 复制 到 其 内 部 缓冲 区 。 对 于 writev 的 情况 ， 因 为 内 核 只 需 将 数据 直接 
复制 进 其 分 段 缓冲 区 ， 所 以 复制 工作 应 当 会 少 一 些 。 但 是 ， 对 于 这 种 少 
量 数据 ， 使 用 writev 的 固定 成 本 大 于 收益 。 随 着 需 复制 数据 的 增加 ， 程 
人 
引力 。 

不 要 依据 图 14-23 中 的 数字 对 Linux 和 Mac OS X 之 间 的 相对 性 能 作 过 
多 的 推 上 新 。 这 两 种 计算 机 有 很 大 差别 : 它们 有 不 同 的 处 理 器 结构 、 不 同 
数量 的 RAM 以 及 不 同 速度 的 磁盘 。 为 了 在 操作 系统 之 间 进 行 公平 的 比 
较 ， 需 要 对 每 一 种 操作 系统 都 使 用 相同 的 硬件 。 

总 之 ， 应 当 用 尽量 少 的 系统 调用 次 数 来 完成 任务 。 如 果 我 们 只 写 少 
量 的 数据 ， 将 会 发 现 上 自己 复制 数据 然后 使 用 一 次 write 会 比 用 writev 更 合 
算 。 但 也 可 能 发 现 ， 我 们 管理 自己 的 分 段 缓冲 区 会 增加 程序 额外 的 复杂 
性 成 本 ， 所 以 从 性 能 成 本 的 角度 来 看 不 合算 。 

















14.7 国 数 readn 和 writen 


管道 、FIFO 以 及 某 些 设备 (特别 是 终端 和 网 络 ) 有 下 列 两 种 性 质 。 

(1) 一 次 read 操 作 所 返回 的 数据 可 能 少 于 所 要 求 的 数据 ， 即 使 还 
没 达到 文件 尾 端 也 可 能 是 这 样 。 这 不 是 一 个 错误 ， 应 当 继 续 读 该 设备 。 

(2) 一 次 write 操作 的 返回 值 也 可 能 少 于 指定 输出 的 字 节 数 。 这 可 
能 是 由 某 个 因素 造成 的 ， 例 如 ， 内 核 输出 绥 冲 区 变 满 。 这 也 不 是 错误 ， 
应 当 继 续 写 余下 的 数据 。〔 通 常 ， 只 有 非 阻塞 揪 述 符 ， 或 捕捉 到 一 个 信 
号 时 ， 才 发 生 这 种 write 的 中 途 返 回 。) 

在 读 、 写 磁盘 文件 时 从 未 见 到 过 这 种 情况 ， 除 非 文 件 系 统 用 完了 空 
间 ， 或 者 接近 了 配额 限制 ， 不 能 将 要 求 写 的 数据 全 部 写 出 。 

通常 ， 在 读 、 写 一 个 管道 、 网 络 设 备 或 终端 时 ， 需 要 考虑 这 些 特 
性 。 下 面 两 个 函数 ”readn 和 writen 的 功能 分 别 是 读 、 写 指定 的 N 字 节 数 
据 ， 并 处 理 返 回 值 可 能 小 于 要 求 值 的 情况 。 这 两 个 函数 只 是 按 需 多 次 调 
用 read 和 write 直至 读 、 写 了 N 字 节 数 据 。 

#include "apue.h" 

ssize_t readn(int fd, void *buf, size_t nbytes); 

ssize_t writen(int fd, void *buf, size_t nbytes); 

两 个 函数 的 返回 值 : 读 、 写 的 字 节 数 ; AH, e- 

类 似 于 本 书 很 多 实例 所 使 用 的 出 错 处 理 例 程 ， 我 们 定义 这 两 个 函数 
0 One ee 
组 成 部 分 。 

在 要 将 数据 写 到 上 面 提 到 的 文件 类 型 上 时 ， 惑 可 调用 writen， 但 是 
仅 当 事先 就 知道 要 接收 数据 的 数量 时 ， 才 调用 readn。 图 14-24 包 含 了 
readn 和 writen 的 实现 ， 在 后 面 的 实例 中 ， 我 们 还 会 用 到 。 











finclude "apue.h" 


ssize t /* Read "n" bytes from a descriptor */ 
readn(int fd, void *ptr, size_t n) 


| 


size t nleft; 
ssize_t nread; 


nleft = n; 
while (nleft > 0) { 
if ((nread = read(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 
else 
break; /* error, return amount read so far */ 
} else if (nread == 0) { 
break; /* EOF */ 
} 
nleft -= nread; 
ptr += nread; 


} 
return(n - nleft); /* return >= 0 */ 


ssize t /* Write "n" bytes to a descriptor */ 
writen(int fd, const void *ptr, size_t n) 


{ 


size t nleft; 
ssize t nwritten; 
nleft = n; 


while (nleft > 0) { 
if ((nwritten = write(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 
else 
break; /* error, return amount written so far */ 
} else if (nwritten == 0) { 
break; 
} 
nleft -= nwritten; 
ptr += nwritten; 


} 


return(n - nleft); /* return >= 0 */ 





图 14-24 readn 和 writen 函数 

注意 ， 知 在 已 经 谈 、 写 了 一 些 数 据 之 后 出 错 ， 则 这 两 个 函数 返回 的 
是 已 传输 的 数据 量 ， 而 非 错误 。 与 此 类 似 ， 在 读 时 ， 如 达到 文件 尾 端 ， 
而 且 在 此 之 前 已 成 功 地 读 了 一 些 数据 ， 但 尚未 满足 所 要 求 的 量 ， 则 
readn 返 回 己 复 制 到 调用 者 缓冲 区 中 的 字 节 数 。 





14.8 TMAR HIO 


存储 映射 TO (memory-mapped I/O) 能 将 一 个 磁盘 文件 映射 到 存储 
空间 中 的 一 个 缓冲 区 上 ， 于 是 ， 当 从 缓冲 区 中 取 数 据 时 ， 天 相当 于 读 文 
件 中 的 相应 字 节 。 与 此 类 似 ， 将 数据 存 入 缓冲 区 时 ， 相 应 字 节 就 自动 写 
入 文件 。 这 样 ， 就 可 以 在 不 使 用 read 和 write 的 情况 下 执行 IO。 

存储 映射 TO 伴随 虚拟 存储 系统 已 经 用 了 很 多 年 。1981 年 ，4.1BSD 
以 其 vread 和 vwrite 了 水 数 提供 了 一 种 不 同形 式 的 存储 映射 JO。4.2BSD 中 
删除 了 这 两 个 函数 ， 试 图 蔡 换 成 mmap 函 数 。 

但 是 4.2BSD 实 际 上 并 没有 包含 mmap 函 数 ( 原 因 见 McKusick 等 
[1996] 中 2.5 节 的 描述 ) 。Gingell、Moran 和 Shannon[1987] 擂 述 了 mmap 
的 一 种 实现 。SUSv4 把 mmap 函 数 从 可 选项 规范 中 移 到 了 基础 规范 中 。 

所 有 的 遵循 POSIX 的 系统 都 需要 文 持 它 。 

为 了 使 用 这 种 功能 ， 应 首先 告诉 内 核 将 一 个 给 定 的 文件 映射 到 一 个 
存储 区 域 中 。 这 是 由 mmap 函 数 实现 的 。 

#include <sys/mman.h> 

void *mmap(void *addr, size_t len, int prot, int flag, int fd, off t off); 

返回 值 : ARJ, TPR Kea, eee, J [al 
MAP FAILED 

addr 参 数 用 于 指定 映射 存储 区 的 起 始 地 址 。 通 各 将 其 设置 为 0， 这 
ee 的 起 始 地 址 。 此 函数 的 返回 值 是 该 映射 区 的 起 

台地 址 。 

fd 参数 是 指定 要 被 映射 文件 的 描述 符 。 在 文件 映射 到 地 址 空间 之 
前 ， 必 须 先 打开 该 文件 。len 参 数 是 映射 的 字 贡 数 ，off 是 要 映射 字 节 在 
文件 中 的 起 始 偏 移 量 (有 关 off 值 的 一 些 限制 将 在 后 面 说 明 ) 。 

prot 参 数 指定 了 映射 存储 区 的 保护 要 求 ， 如 图 14-25 所 示 。 











PROT READ 映射 区 可 读 


PROT WRITE 映射 区 可 与 
PROT EXEC 映射 区 可 执行 
PROT NONE 映射 区 不 可 访问 








图 14-25 映射 存储 区 的 保护 要 求 

可 将 prot 参 数 指定 为 PROT_NONE， 也 可 指定 为 PROT_READ、 
PROT_WRITE 和 PROT_EXEC 的 任意 组 合 的 按 位 或 。 对 指定 映射 存储 区 
的 保护 要 求 不 能 超过 文件 open 模 式 访问 权限 。 例 如 ， 若 该 文件 是 只 读 打 
开 的 ， 那 么 对 映射 存储 区 就 不 能 指定 PROT_WRITE。 

在 说 明 flag 参 数 之 前 ， 先 看 一 下 存储 映射 文件 的 基本 情况 。 图 14-26 
显示 了 一 个 存储 映射 文件 。( 见 图 7-6 中 所 示 的 典型 进程 的 存储 器 安 
排 。) 在 此 图 中 ，“ 起 始 地 址 ”是 mmap 的 返回 值 。 映 射 存储 区 位 于 堆 和 
栈 之 间 : 这 属于 实现 细节 ， 各 种 实现 之 间 可 能 不 同 。 

下 面 是 flag 参 数 影响 映射 存储 区 的 多 种 属性 。 

MAP FIXED 返回 值 必须 等 于 addr。 因 为 这 不 利于 可 移植 性 ， 所 以 
不 或 励 使 用 此 标志 。 如 果 未 指定 此 标志 ， 而 且 addr 非 0， 则 内 核 只 把 addr 
视 为 在 何 处 设置 映射 区 的 一 种 建议 ， 但 是 不 保证 会 使 用 所 要 求 的 地 址 。 
将 addr 指 定 为 0 可 获得 最 大 可 移植 性 。 

在 遵循 POSIX 的 系统 中 ， 对 MAP_FIXED 标 志 的 支持 是 可 选择 的 ， 
但 遵循 XSI 的 系统 则 要 求 文 持 MAP_FIXED。 

MAP_SHARED 这 一 标志 描述 了 本 进程 对 映射 区 所 进行 的 存储 操作 
的 配置 。 此 标志 指定 存储 操作 修改 映射 文件 ， 也 就 是 ， 存 储 操 作 相 当 于 
对 该 文件 的 write。 必 须 指定 本 标志 或 下 一 个 标志 (MAP_PRIVATE) ， 
但 不 能 同时 指定 两 者 。 

MAP_PRIVATE 本 标志 说 明 ， 对 映射 区 的 存储 操作 导致 创建 该 映射 
文件 的 一 个 私有 副本 。 所 有 后 来 对 该 映射 区 的 引用 都 是 引用 该 副本 。 
(此 标志 的 一 种 用 途 是 用 于 调试 程序 ， 它 将 程序 文件 的 正文 部 分 映射 至 
存储 区 ， 但 允许 用 户 修改 其 中 的 指令 。 任 何 修改 只 影响 程序 文件 的 副 
本 ， 而 不 影响 原文 件 。) 
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图 14-26 存储 映射 文件 的 例子 

每 种 实现 都 可 能 还 有 另外 一 些 MAP xxx 标志 值 ， 它 们 是 那 种 实现 
所 特有 的 。 详 细 情 况 请 参见 你 所 使 用 系 mn 

off 的 值 和 addr 的 值 〈( 如 果 指 定 了 MAP_FIXED) 通常 被 要 求 是 系统 
虚拟 存储 页 长 度 的 倍数 。 虚 拟 存储 页 长 可 用 带 参 数 _SC_PAGESIZE 或 
_SC_PAGE_SIZE 的 sysconf 函 数 《〈 见 2.5.4 节 ) 得 到 。 因 为 of 和 addr 常 常 
ne 所 以 这 种 要 求 一 般 并 不 重要 。 

要 求 通常 是 由 系统 实现 强加 的 。 尺 管 Single UNIX Specification 





不 再 要 求 满足 该 条 件 ， 但 是 所 有 本 书 中 讲 到 的 除了 FreeBSD ”8.0 以 外 的 
所 有 平台 都 满足 了 这 一 要 求 。FreeBSD 8.0 人 允许 我 们 使 用 任意 的 地 址 对 
齐 和 偏 移 对 齐 ， 只 要 对 齐 匹 配 即 可 。 

既然 映射 文件 的 起 始 偏 移 量 受 系统 虚拟 存储 页 长 上 度 的 限制 ， 那 么 如 
果 映 射 区 的 长 度 不 是 页 长 的 整数 倍 时 ， 会 怎么 样 呢 ? 假 定 文件 长 为 ”12 
字 节 ， 系 统 页 长 为 512 字 节 ， 则 系统 通常 提供 512 字 节 的 映射 区 ， 其 中 
后 500 字 节 被 设置 为 0。 可 以 修改 后 面 的 这 500 字 节 ， 但 任何 变动 都 不 会 
在 文件 中 反映 出 来 。 于 是 ， 不 能 用 mmap 将 数据 添加 到 文件 中 。 我 们 必 
须 先 加 长 该 文件 ， 如 后 面 的 图 14-27 中 的 程序 所 示 。 

与 映射 区 相关 的 信号 有 SIGSEGV 和 SIGBUS。 信 号 ”SIGSEGV 通 常 
用 于 指示 进程 试图 访问 对 它 不 可 用 的 存储 区 。 如 果 映 射 存储 区 被 mmap 
指定 成 了 只 该 的， 那么 进程 试图 将 数据 存 入 这 个 映射 存储 区 的 时 候 ， 也 
会 产生 此 信号 。 如 果 映 射 区 的 某 个 部 分 在 访问 时 已 不 存在 ， 则 产生 
SIGBUS 信 和 号。 例如， 假设 用 文件 长 度 映射 了 一 个 文件 ， 但 在 引用 该 映 
射 区 之 前 ， 另 一 个 进程 已 将 该 文件 截断 。 此 时 ， 如 果 进 程 试图 访问 对 应 
于 该 文件 已 截 去 部 分 的 映射 区 ， 将 会 接收 到 SIGBUS 信 号。 

子 进 程 能 通过 fork 继 承 存 储 上 映射 区 《因为 子 进 程 复制 父 进程 地 址 空 
间 ， 而 存储 上 映射 区 是 该 地 址 空间 中 的 一 部 分 ) ， 但 是 由 于 同样 的 原因 ， 
新 程序 则 不 能 通过 exec 继 承 存储 映射 区 。 

调用 mprotect 可 以 更 改 一 个 现 有 了 映射 的 权限 。 

#include <sys/mman.h> 

int mprotect(void *addr, size_t len, int prot); 

返回 值 : 知 成 功 ， 返 回 0; 大 出 错 ， 返 回 -1 

prot 的 合法 值 与 nmap 中 prot 参 数 的 一 样 〈 见 图 14-25) 。 请 注意 ， 地 
址 参数 addr 的 值 必须 是 系统 页 长 的 整数 倍 。 

如 果 修 改 的 页 是 通过 MAP_SHARED 标 志 映 射 到 地 址 空间 的 ， 那 么 
修改 并 不 会 立即 写 回 到 文件 中 。 相 反 ， 何 时 写 回 脏 页 由 内 核 的 守护 进程 
决定 ， 决 定 的 依据 是 系统 负载 和 用 来 限制 在 系统 失败 事件 中 的 数据 损失 
的 配置 参数 。 因 此 ， 如 采 只 修改 了 一 页 中 的 一 个 字 节 ， 当 修改 被 写 回 到 
文件 中 时 ， 整 个 页 都 会 被 写 回 。 

如 果 共 享 映 射 中 的 页 已 修改 ， 那 么 可 以 调用 msync 将 该 页 冲洗 到 被 
的 文件 中 。msync 函 数 类 似 于 fsync( 见 3.13 节 )〉 ， 但 作用 于 存储 映 
TIX, 

#include <sys/mman.h> 

int msync(void *addr, size_t len, int flags); 

返回 值 : AR, WO; 大 出 错 ， 返 回 -1 

如 果 映 射 是 私有 的 ， 那 么 不 修改 被 映射 的 文件 。 与 其 他 存储 上 映射 函 





























数 一 样 ， 地 址 必须 与 页 边界 对 齐 。 

flags 参 数 使 我 们 对 如 何冲 洗 存 储 区 有 某 种 程度 的 控制 。 可 以 指定 
MS_ASYNC 标志 来 简单 地 调试 要 写 的 页 。 如 果 和 希望 在 返回 之 前 等 待 写 
操作 完成 ， 则 可 指定 MS SYNC 标志。 一 定 要 指定 MS_ASYNC 和 
MS_SYNC 中 的 一 个 。 

MS_INVALIDATE 是 一 个 可 选 标 志 ， 人 允许 我 们 通知 操作 系统 丢弃 那 
些 与 底层 存储 器 没有 同步 的 页 。 知 使 用 了 此 标志 ， 某 些 实现 将 丢弃 指定 
范围 中 的 所 有 页 ， 但 这 种 行为 并 不 是 必需 的 。 

msync 函 数 包 含 在 Single UNIX Specification 的 XSI 选 项 中 。 因 此 ， 所 
有 UNIX 系 统 必 须 支 持 它 。 

当 进 程 终 止 时 ， 会 自动 解除 存储 映射 区 的 映射 ， 或 者 直接 调用 
munmap 函 数 也 可 以 解除 映射 区 。 关 闭 映 射 存储 区 时 使 用 的 文件 描述 符 
并 不 解除 映射 区 。 

#include <sys/mman.h> 

int munmap(void *addr, size_t len); 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

munmap 并 不 影响 被 映射 的 对 象 ， 也 惑 是 说 ， 调 用 munmap 并 不 会 使 
映射 区 的 内 容 写 到 磁盘 文件 上 。 对 于 MAP_SHARED 区 磁盘 文件 的 更 
新 ， 会 在 我 们 将 数据 写 到 存储 映射 区 后 的 某 个 时 刻 ， 按 内 核 虚 拟 存 储 算 
NAF o 


实例 
图 14-27 中 的 程序 用 存储 映射 TO 复制 文件 《类 似 于 cp 人 1) 命令 ) 。 





#include "apue.h" 
finclude <fcntl.h> 
tinclude <sys/mman,h> 


#define COPYINCR (1024*1024*1024) /* 1 GB */ 


int 
main(int argc, char *argv[]) 


{ 


int fdin, fdout; 
void tary *dst; 
size t copysz; 
struct stat sbuf; 

off t fsz = 0; 


if (arge != 3) 
err quit ("usage: %s <fromfile> <tofile>", argv[0]); 


if ((fdin = open(argv[1], O_RDONLY)) < 0) 
err_sys("can't open %s for reading", argv[1]); 


if ((fdout = open(argv[2], O_RDWR | O_CREAT | O_TRUNC, 
FILE MODE)) < 0) 
err_sys("can't creat %s for writing", argv[2]); 


if (fstat(fdin, &sbuf) < 0) /* need size of input file */ 
err_sys("fstat error"); 


if (ftruncate(fdout, sbuf.st_size) < 0) /* set output file size */ 
err_sys("ftruncate error"); 


while (fsz < sbuf.st_size) { 
if ((sbuf.st_size - fsz) > COPYINCR) 
copysz = COPYINCR; 
else 
copysz = sbuf.st_size - fsz; 


if ((src = mmap(0, copysz, PROT READ, MAP SHARED, 
fdin, fsz)) == MAP FAILED) 
err_sys ("mmap error for input"); 
if ((dst = mmap(0, copysz, PROT_READ | PROT_WRITE, 
MAP_SHARED, fdout, fsz)) == MAP_FAILED) 
err_sys("mmap error for output"); 


memcpy(dst, src, copysz); /* does the file copy */ 
munmap (src, copysz); 
munmap (dst, copysz); 
fsz += copysz; 
} 
exit (0); 


图 14-27 用 存储 映射 UO 复制 文件 

该 程序 首先 打开 两 个 文件 ， 然 后 调用 fstat 得 到 输入 文件 的 长 度 。 在 
为 输入 文件 调用 mmap 和 设置 输出 文件 长 度 时 都 需 使 用 输入 文件 长 度 。 
可 以 调用 ftruncate 设 置 输出 文件 的 长 度 。 如 果 不 设 置 输出 文件 的 长 度 ， 
则 对 输出 文件 调用 mmap 也 可 以 ， 但 是 对 相关 存储 区 的 第 一 次 引用 会 产 
生 SIGBUS 信 号。 

然后 对 每 个 文件 调用 mmap， 将 文件 映射 到 内 存 ， 最 后 调用 memcpy 
将 输入 缓冲 区 的 内 容 复 制 到 输出 缓冲 区 。 为 了 限制 使 用 内 存 的 量 ， 我 们 
每 次 最 多 复制 1 GB 的 数据 〈 如 果 系 统 没有 足够 的 内 存 ， 可 能 无 法 把 一 
个 很 大 的 文件 中 的 所 有 内 容 都 映射 到 内 存 中 ) 。 在 映射 文件 中 的 后 一 部 
分 数据 之 前 ， 我 们 需要 解除 前 一 部 分 数据 的 映射 。 

在 从 输入 绥 冲 区 〈src) 取 数 据 字 节 时 ， 内 核 上 自动 读 输 入 文件 ;在 将 
数据 存 入 输出 缓冲 区 〈dst) 时 ， 内 核 自 动 将 数据 写 到 输出 文件 中 。 

数据 被 写 到 文件 的 确切 时 间 依 赖 于 系统 的 页 管理 算法 。 某 些 系统 设 
置 了 守护 进程 ， 在 系统 运行 期 间 ， 它 慢 条 斯 理 地 将 改写 过 的 页 写 到 磁盘 
dee 如 果 想 要 确保 数据 安全 地 写 到 文件 中 ， 则 需 在 进程 终止 前 以 
MS_SYNC 标 志 调 用 msync。 

将 存储 区 映射 复制 与 用 read 和 write 进行 的 复制 〈 绥 冲 区 长 度 为 8 
192) 相 比 较 ， 得 到 图 14-28 中 所 示 的 结果 。 其 中 ， 时 间 单 位 是 秒 ， 被 复 
ee 度 是 300 ” MB。 注意 ， 我 们 并 没有 在 退出 前 将 数据 同步 到 磁 


Linux 3.2.0 (Intel x86) Solaris 10 (SPARC) 


ia | me | ae |e 


read/write 0.54 5.67 0.29 10.60 43.67 
mmap/memepy 01.65 22.54 1,89 8.56 38.42 


图 14-28 read/write Smmap/memcpy Ll #6 Hy IN la] 44 R 

在 Linux 3.2.0 和 Solaris 10 中 ， 两 种 方法 的 总 的 CPU 时 间 (用 户 时 间 
+ 系统 时 间 ) 几乎 是 相同 的 。 在 Solaris 中 ， 使 用 mmap 和 memcpy 复 制 ， 
ee 比 ， 花 费 了 更 多 的 用 户 时 间 ， 但 却 减 少 了 系统 时 

。 在 Linux 中 ， 用 户 时 间 的 结果 很 相似 ， 但 是 用 read 和 write 消耗 的 系统 
间 要 要 比 使 用 mmap 和 memcpy 略 好 一 些 。 这 两 种 版 本 的 方法 是 殊途同归 























二 者 的 主要 区 别 在 于 ， 与 nmap 和 memcpy 相 比 ，read 和 write 执行 了 
更 多 的 系统 调用 ， 并 做 了 更 多 的 复制 。read 和 write 将 数据 从 内 核 缓冲 区 
中 复制 到 应 用 绥 冲 区 (read) ， 然 后 再 把 数据 从 应 用 缓冲 区 复制 到 内 核 
缓冲 区 Cwrite) 。 而 mmap 和 memcpy 则 直接 把 数据 从 映射 到 地 址 空间 的 
一 个 内 核 缓冲 区 复制 到 男 一 个 内 核 缓冲 区 。 当 引用 疝 不 存在 的 内 存 页 
时 ， 这 样 的 复制 过 程 束 会 作为 处 理 页 错误 的 结果 而 出 现 〈 每 次 错 页 读 友 
生 一 次 错误 ， 每 次 错 页 写 发 生 一 次 错误 ) 。 如 果 系 统 调用 和 额外 的 复制 
操作 的 开销 和 页 错误 的 开销 不 同 ， 那 么 这 两 种 方法 中 就 会 有 一 种 比 另 一 
种 表现 更 好 。 

在 Linux 3.2.0 中 ， 相 对 于 运行 时 间 ， 两 种 版 本 的 程序 在 时 钟 时 间 上 
显示 出 了 巨大 的 差异 : 使 用 read 和 write 的 版 本 完成 任务 比 使 用 mmap 和 
memcpy 的 版 本 快 了 4 倍 。 然 而 在 Solaris 10 中 ， 使 用 mmap 和 memcpy 的 版 
本 比 使 用 read 和 write 的 版 本 要 快 。 既 然 二 者 的 CPU 时 间 几 乎 是 相同 的 ， 
为 何 它们 的 时 钟 时 间 差 异 却 如 此 之 大 呢 ? 一 种 可 能 是 ， 在 一 种 版 本 中 需 
要 较 长 的 时 间 来 等 竺 1O 完 成 。 这 个 等 待 时 间 并 没有 计算 在 CPU 的 处 理 
时 间 中 。 另 一 种 可 能 是 ， 某 些 系 统 处 理 的 时 间 可 能 并 没有 在 程序 中 计 
算 ， 比 如 系统 守护 进程 把 页 写 到 磁盘 中 的 操作 。 由 于 需要 为 恋 和 写 分 配 
页 ， 系 统 的 守护 进程 会 帮助 我 们 准备 可 用 的 页 。 如 果 页 的 写 操作 是 随机 
的 而 非 连续 的 ， 那 么 把 它们 写 入 磁盘 所 需要 的 时 间 会 更 长 ， 因 此 在 页 可 
以 被 用 来 复 用 之 前 所 需 等 待 的 时 间 也 会 更 长 。 

有 的 系统 将 一 个 普通 文件 复制 到 男 一 个 普通 文件 中 时 ， 存 储 映射 
IO 可 能 会 比较 快 。 但 是 有 一 些 限 制 ， 例 如 ， 不 能 用 这 种 技术 在 某 些 设 
备 之 间 《 如 网 络 设备 或 终端 设备 ) 进行 复制 ， 并 且 在 对 被 复制 的 文件 进 
行 映 射 后 ， 也 要 注意 该 文件 的 长 度 是 否 改变 。 尽 管 如 此 ， 某 些 应 用 程序 
仍然 能 得 益 于 存储 映射 IO， 因 为 它 处 理 的 是 存储 空间 而 不 是 读 、 写 一 
个 文件 ， 所 以 种 各 可 以 简化 算法 。 从 存储 上 映射 TO 中 得 益 的 一 个 例子 是 
对 帧 缓冲 设备 的 操作 ， 该 设备 引用 位 图 式 显 示 (bit-mapped display) 。 

Krieger、Stumm 和 Unrau[1992] 描 述 了 一 个 使 用 存储 映射 TO 的 标准 
IO 库 《〈 见 第 5 章 ) 。 

15.9 节 还 会 提 到 存储 映射 ILO， 其 中 还 举 了 一 个 例子 ， 说 明 如 何 使 用 
存储 映射 VO 在 两 个 相关 进程 间 提 供 共 享 存储 区 。 


























14.9 小 结 


本 章 描 述 了 很 多 高 级 MO 功能 ， 其 中 有 许多 将 用 在 后 面 章节 的 实例 


” 非 阻塞 UO_ ”发 一 个 IO 操作 ， 不 使 其 阻塞 。 
.记录 锁 〈 在 第 20 章 中 有 一 个 实例 ， 该 实例 会 对 此 进行 更 详细 的 讨 


WO 多 路 转 接 -selectfpol 函 数 《在 后 面 的 很 多 实例 中 会 用 到 这 丙 

SPR AL) 。 

m e readvfllwriteve žit Æ Ja I (SE te H AA R 

数 ) 。 
“存储 映射 UO (mmap) 。 











习题 











14.1 编写 一 个 测试 程序 说 明 你 所 用 系统 在 下 列 情况 下 的 运行 情况 : 
一 个 进程 在 试图 对 一 个 文件 的 茶 个 范围 加 写 锁 的 时 候 阻 蹇 ， 之 后 其 他 进 
程 又 提出 了 一 些 相关 的 加 读 锁 请 求 。 试 图 加 写 锁 的 进程 会 不 会 因此 而 饿 
HE? 


14.2 碍 看 你 所 用 系统 的 头 文 件 ， 并 研究 select 和 4 个 FD_ 宏 的 实现 。 

14.3 系统 头 文件 通常 对 fd_set 数据 类 型 可 以 处 理 的 最 大 描述 符 数 有 
一 个 内 置 的 限制 ， 假 设 需 要 将 描述 符 数 增加 a 到 2 048， 该 如 何 实现 ? 

14.4 比较 处 理 信 号 量 集 的 函数 〈 见 10.11 节 ) 和 处 理 fd_set 描 述 符 集 
的 函数 ， 并 比较 这 两 类 函数 在 你 系统 上 的 实现 。 

14.5 ”用 select 或 poll 实 现 一 个 与 sleep 类 似 的 函数 sleep_us， 不 同 之 处 
是 要 等 待 指定 的 知 干 微 秒 。 比 较 这 个 函数 和 BSD 中 的 usleep 函 数 。 

14.6 ”是 否 可 以 利用 建议 性 记录 锁 来 实现 图 10-24 ”中 的 函数 
TELL WAIT、 TELL PARENT、 TELL CHILD、WAIT PARENT 以 及 
WAIT_CHILD? 如 果 可 以 ， 编 写 这 些 函 数 并 测试 其 功能 。14.7 HIEM 
写 来 确定 管道 的 容量 。 将 其 值 与 第 2 章 的 PIPE_BUF 值 进行 比较 。 

14.8” 重 写 图 14-21 中 的 程序 来 制作 一 个 过 滤器 : 从 标准 输入 中 读 入 
并 癌 标 准 输 出 写 ， 但 是 要 使 用 异步 /O 接 口 。 为 了 使 之 能 正常 工作 ， 你 
都 需要 修改 些 什么 ? 记 住 ， 无 论 你 的 标准 输出 被 连接 到 终端 、 管 道 还 是 
一 个 普通 文件 ， 都 应 该 得 到 相同 的 结果 。 

14.9 ”回忆 图 14-23， 在 你 的 系统 上 找到 一 个 损益 平衡 点 ， 从 此 点 开 
始 ， 使 用 writev 将 快 于 你 自己 使 用 单个 write 复 制 数 据 。 

14.10 运行 图 14-27 中 的 程序 复制 一 个 文件 ， 检 查 输 入 文件 的 上 一 次 
访问 时 间 是 否 更 新 了 ? 

14.11 在 图 14-27 的 程序 中 ， 在 调用 mmap 后 调用 close 关 闭 输 入 文 
件 ， 以 验证 关闭 描述 符 不 会 使 内 存 映 射 TO 失 效 。 
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第 8 章 说 明了 进程 控制 原 语 ， 并 且 观 察 了 如 何 调用 多 个 进程 。 但 是 
这 些 进程 之 间 交 换 信 息 的 唯一 途径 就 是 传送 打开 的 文件 ， 可 以 经 由 fork 
或 exec 来 传送 ， 也 可 以 通过 文件 系统 来 传送 。 本 章 将 说 明 进 程 之 间 相 互 
通信 的 其 他 技术 一 进程 间 通 信 (InterProcess Communication, IPC) 。 

过 去 ，UNIX 系 统 IPC 是 各 种 进程 通信 方式 的 统称 ， 但 是 ， 这 些 通信 
方式 中 极 少 有 能 在 所 有 UNIX 系 统 实现 中 进行 移植 的 。 随 着 POSIX 和 The 
Open Group (LAB + X/Open) 标准 化 的 推进 和 影响 的 扩大 ， 情 况 已 得 到 
改善 ， 但 差别 仍然 存在 。 图 15-1 摘 要 列 出 了 本 书 讨论 的 4 种 实现 所 支持 
的 不 同形 式 的 IPC。 


Pc 类 型 AaLi FreeBSD80 | Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


半 双 工 管道 

FIFO 
ANT Ail 
命名 全 双 工 管道 
XSI 消息 队 列 


XSI 信号 量 

XS[ 共 享 存储 

消息 队列 (实时) | MSG 选项 
ie 

共享 存储 (实时 ) | SHM 选项 


本 
STREAMS _ 








图 15-1 UNIX 系 统 IPC 摘 要 

注意 ， 虽 然 Single UNIX Specification (“SUS” 列 〉 要 求 的 是 半 双 工 
管道 ， 但 允许 实现 文 持 全 双 工 管道 。 即 使 应 用 程序 在 编写 时 假定 基础 操 
作 系 统 只 支持 半 双 工 管道 ， 支 持 全 双 工 管道 的 实现 也 能 用 这 种 应 用 程序 
正常 工作 。 图 中 使 用 “(全 ) ”表示 用 全 双 工 管道 文 持 半 双 工 管道 的 实 
现 。 

在 图 15-1 中 ， 我 们 在 文 持 基 本 功能 的 位 置 处 标注 了 一 个 黑 点 。 对 于 
全 双 工 管道 ， 如 果 该 特征 是 经 由 UNIX 域 套 接 字 (UNIX domain socket, 
见 17.2 节 ) 支持 的 ， 则 在 相应 列 中 标注 “UDS”。 茶 些 实现 用 管道 和 UNIX 
域 套 接 字 来 文 持 该 特征 ， 所 以 这 些 位 置 上 标 有 “、UDS”。 

IPC 接 口 作 为 POSIX.1 实 时 扩展 的 一 部 分 ， 也 是 Single UNIX 
Specification 中 的 选项 。 在 SUSv4 中 ， 信 号 量 接口 从 可 选 规范 移 到 了 基本 
规范 中 。 

虽然 命名 全 双 工 管道 作为 被 挂 载 的 基于 STREAMS 的 管道 使 用 ， 但 
ye Single UNIX Specification 将 它 标记 成 弃 用 的 。 

尽管 Linux 中 OpenSS7 项 目的 “Linux Fast-STREAMS” 包 支持 

















STREAMS， 但 是 这 个 包 最 近 都 没有 更 新 。 从 2008 年 以 来 最 新 的 包 版 本 
只 到 内 核 版 本 2.6.26。 

图 15-1 中 前 10 种 IPC 形 式 通 常 限于 同一 台 主 机 的 两 个 进程 之 间 的 
IPC。 最 后 两 行 ( 套 接 字 和 STREAMS) 是 仅 有 的 支持 不 同 主机 上 两 个 进 
程 之 间 IPC 的 两 种 形式 。 

我 们 将 与 IPC 有 关 的 讨论 分 成 3 章 。 本 章 讨论 经 典 的 IPC: 管道 、 
FIFO、 消 息 队 列 、 信 号 量 以 及 共享 存储 。 下 一 章 讨论 使 用 套 接 字 机 制 的 
网 络 IPC。 第 17 章 说 明 IPC 的 某 些 高 级 特征 。 





15.2 管道 


管道 是 UNIX 系 统 IPC 的 最 古老 形式 ， 所 有 UNIX 系 统 都 提供 此 种 通 
信 机 制 。 管 道 有 以 下 两 种 局 限 性 。 

(1) 历史 上 ， 它 们 是 半 双 工 的 〈 即 数据 只 能 在 一 个 方向 上 流 
动 ) 。 现 在 ， 某 些 系 统 提供 全 双 工 管道 ， 但 是 为 了 最 佳 的 可 移植 性 ， 我 
们 决 不 应 预先 假定 系统 支持 全 双 工 管道 。 

(2) 管道 只 能 在 具有 公共 祖先 的 两 个 进程 之 间 使 用 。 通 常 ， 一 个 
管道 由 一 个 进程 创建 ， 在 进程 调用 fork 之 后 ， 这 个 管道 就 能 在 父 进程 和 
子 进程 之 间 使 用 了 。 

我 们 将 会 看 到 FIFO 〈 见 15.5 节 ) 没有 第 二 种 局 限 性 ，UNIX 域 套 接 
字 〔( 见 17.2 节 ) 没有 这 两 种 局 限 性 。 

尽管 有 这 两 种 局 限 性 ， 半 双 工 管道 仍 是 最 常用 的 IPC 形 式 。 每 当 在 
管道 中 键入 一 个 命令 序列 ， 让 shell 执行 时 ，shell 都 会 为 每 一 条 命令 单 
独创 建 一 个 进程 ， 然 后 用 管道 将 前 一 条 命令 进程 的 标准 输出 与 后 一 条 命 
令 的 标准 输入 相连 接 。 

管道 是 通过 调用 pipe 函 数 创建 的 。 

#include <unistd.h> 

int pipe(int fd[2]); 

















经 由 参数 fd 返回 两 个 文件 描述 符 : fd[0] 为 读 而 打开 ，fd[1] 为 写 而 
打开 。fd[1] 的 输出 是 fd[0] 的 输入 。 

最 初 在 4.3BSD 和 4.4BSD 中 ， 管 道 是 用 UNIX 域 套 接 字 实 现 的 。 虽 然 
UNIX 域 套 接 字 默 认 是 全 双 工 的 ， 但 这 些 操作 系统 阻碍 了 用 于 管道 的 套 
接 字 ， 以 至 于 这 些 管道 只 能 以 半 双 工 模 式 操作 。 

POSIX.1 人 允许 实现 支持 全 双 工 管道 。 对 于 这 些 实现 ，fd[0] 和 fd[1] 以 
SIAN. 

图 15-2 中 给 出 了 两 种 描绘 半 双 工 管道 的 方法 。 左 图 显示 管道 的 两 端 
在 一 个 进程 中 相互 连接 ， 右 图 则 强调 数据 需要 通过 内 核 在 管道 中 流动 。 

fstat 函 数 〈 见 4.2 节 ) 对 管道 的 每 一 端 都 返回 一 个 FIFO 类 型 的 文件 描 
述 符 。 可 以 用 S_ISFIFO 宏 来 测试 管道 。 

POSIX.1 规 定 stat 结 构 的 st_size 成 员 对 于 管道 是 未 定义 的 。 但 是 当 
fstat 函 数 应 用 于 管道 读 端 的 文件 描述 符 时 ， 很 多 系统 在 st_size 中 存储 管 
道中 可 用 于 读 的 字 节 数 。 但 是 ， 这 是 不 可 移植 的 。 

















用 户 进程 用 户 进程 


或 者 








fd[0] fd[1] 





fd[0] fd[1] 


图 15-2 描绘 半 双 工 管道 的 两 种 方法 

单个 进程 中 的 管道 几乎 没有 任何 用 处 。 通 常 ， 进 程 会 先 调用 pipe， 
接着 调用 fork， 从 而 创建 从 父 进程 到 子 进 程 的 IPC 通 道 ， 反 之 亦 然 。 图 
15-3 显 示 了 这 种 情况 。 








子 进程 





图 15-3 fork 之 后 的 半 双 工 管 道 
fork 之 后 做 什么 取决 于 我 们 想 要 的 数据 流 的 方向 。 对 于 从 父 进程 到 
子 进程 的 管道 ， 父 进程 关闭 管道 的 读 端 〈fd[0]) ， 子 进程 关闭 写 端 
(fd[1]) 。 图 15-4 显 示 了 在 此 之 后 描述 符 的 状态 结果 。 








父 进程 子 进程 





内 核 
图 15-4 从 父 进程 到 子 进程 的 管道 























对 于 一 个 从 子 进 程 到 父 进程 的 管道 ， 父 进程 关闭 fd[1]， 子 进程 关闭 
fd[0]。 

当 管 道 的 一 端 被 关闭 后 ， 下 列 两 条 规则 起 作用 。 

(1) HÈ Cread) 一 个 写 端 已 被 关闭 的 管道 时 ， 在 所 有 数据 都 被 
读 取 后 ，read 返 回 0， 表 示 文 件 结束 。 (从 技术 上 来 讲 ， 如 果 管 道 的 写 
端 还 有 进程 ， 就 不 会 产生 文件 的 结束 。 可 以 复制 一 个 管道 的 描述 符 ， 使 
得 有 多 个 进程 对 它 具 有 写 打 开 文 件 描 述 符 。 但 是 ， 通 常 一 个 管道 只 有 一 
个 读 进程 和 一 个 写 进程 。 下 一 节 介 绍 FIFO 时 ， 会 看 到 对 于 单个 的 FIFO 
常常 有 多 个 写 进程 。) 

(2) 如 果 写 (write) 一 个 读 端 已 被 关闭 的 管道 ， 则 产生 信和 号 
SIGPIPE。 如 果 和 忽略 该 信号 或 者 捕捉 该 信号 并 从 其 处 理 程序 返回 ， 则 
write 返 回 -1，errno 设 置 为 EPIPE。 

在 写 管道 (或 FIFO) 时 ， 常 量 PIPE_BUF 规定 了 内 核 的 管道 缓冲 
区 大 小 。 如 果 对 管道 调用 write， 而 且 要 求 写 的 字 节 数 小 于 等 于 
PIPE_BUF， 则 此 操作 不 会 与 其 他 进程 对 同一 管道 (或 FIFO) 的 write 
操作 交叉 进行 。 但 是 ， 若 有 多 个 进程 同时 写 一 个 管道 (或 FIFO), W 
日 我 们 要 求 写 的 字 节 数 超过 PIPE_BUF， 那 么 我 们 所 写 的 数据 可 能 会 与 
其 他 进程 所 写 的 数据 相互 交叉 。 用 pathconf 或 fpathconf 函 数 〈 见 图 2-12 ) 














可 以 确定 PIPE_BUF 的 值 。 

实例 

图 15-5 程序 创建 了 一 个 从 父 进程 到 子 进程 的 管道 ， 并 且 父 进程 经 
由 该 管道 辣子 进程 传送 数据 。 


finclude "apue ,hn 
int 


main (void) 


| 


int n; 
int fd[2]; 
pidt pid; 


char line [MAXLINE] ; 


if (pipe(fd) < 0) 
err sys("pipe error"); 
if ((pid = fork()) < 0) { 
err sys("fork error"); 


} else if (pid > 0) { /* parent */ 
close (fd[0]); 
write (fd[1], "hello world\n", 12); 

} else | /* child */ 
close(fd{1]); 


n= read(fd{0], line, MAXLINE); 
write (STDOUT FILENO, line, n); 


| 
exit (0); 











图 15-5 经 由 管道 从 父 进程 向 子 进 程 传 送 数 据 

注意 ， 这 里 的 管道 方向 和 图 15-4 中 的 是 一 致 的 。 

在 上 面 的 例子 中 ， 直 接 对 管道 描述 符 调 用 了 read 和 write。 更 有 趣 的 
是 将 管道 描述 符 复 制 到 了 标准 输入 或 标准 输出 上 。 通 常 ， 子 进程 会 在 此 
之 后 执行 男 一 个 程序 ， 该 程序 或 者 从 标准 输入 (已 创建 的 管道 ) 读数 
A aa 

SE fl 

试 着 编写 一 个 程序 ， 其 功能 是 每 次 一 页 地 显示 已 产生 的 输出 。 己 经 
有 很 多 UNIX 系 统 公用 程序 具有 分 页 功能 ， 因 此 无 需 再 构造 一 个 新 的 分 
页 程序 ， 只 要 调用 用 户 最 喜爱 的 分 页 程序 就 可 以 了 。 为 了 避免 先 将 所 有 
数据 写 到 一 个 临时 文件 中 ， 然 后 再 调用 系统 中 有 关 程 序 显示 该 文件 ， 我 
们 希望 通过 管道 将 输出 直接 送 到 分 页 程序 。 为 此 ， 先 创建 一 个 管道 ， 
fork 一 个 子 进程 ， 使 子 进程 的 标准 输入 成 为 管道 的 读 端 ， 然 后 调用 
exec， 执 行 用 的 分 页 程序 。 图 15-6 中 的 程序 显示 了 如 何 实现 这 些 操作 。 
《本 例 要 求 在 命令 行 中 有 一 个 参数 指定 要 显示 的 文件 的 名 称 。 通 常 ， 这 
种 类 型 的 程序 要 求 在 终 问 上 显示 的 数据 已 经 在 存储 器 中 了 。) 


























#include "apue.h" 
#include <sys/wait.h> 


#define DEF_PAGER "/bin/more" /* default pager program */ 
int 


Main(int argc, char *argv[]) 


{ 


int n; 

int fd[2]; 

pid_t pid; 

char *pager, *argv0; 
char line [MAXLINE]; 
FILE ED? 


if (arge != 2) 
err_quit ("usage: a.out <pathname>") ; 


if ((fp = fopen(argv[1], "r")) == NULL) 
err_sys ("can't open %s", argv[1]); 
if (pipe(fd) < 0) 
err_sys("pipe error"); 


if ((pid = fork()) < 0) { 
err_sys("fork error"); 

} else if (pid > 0) { /* parent */ 
close(fd[0]); /* close read end */ 


/* parent copies argv[1] to pipe */ 

while (fgets(line, MAXLINE, fp) != NULL) { 
n = strlen (line); 
if (write(fd[1], line, n) != n) 

err_sys ("write error to pipe"); 

} 

if (ferror (fp)) 
err_sys ("fgets error"); 


close(fd[1]); /* close write end of pipe for reader */ 


if (waitpid(pid, NULL, 0) < 0) 
err_sys("waitpid error"); 


exit (0); 

} else { /* child */ 
close (fd[1]); /* close write end */ 
if (fd[0] != STDIN_FILENO) { 


if (dup2(fd[0], STDIN_FILENO) != STDIN_FILENO) 
err_sys("dup2 error to stdin"); 
close (fd[0]);/* don't need this after dup2 */ 


/* get arguments for execl() */ 
if ((pager = getenv("PAGER")) == NULL) 
pager = DEF PAGER; 
if ((argvd = strrchr(pager, '/')) != NULL) 
argvi+; /* step past rightmost slash */ 
else 
argv) = pager; /* no slash in pager */ 


if (execl (pager, argv, (char *)0) < 0) 
err_sys("execl error for %s", pager); 
} 
exit (0); 





图 15-6 将 文件 复制 到 分 页 程序 

在 调用 fork 之 前 ， 先 创建 一 个 管道 。 调 用 fork 之 后 ， 父 进程 关闭 其 
读 端 ， 子 进程 关闭 其 写 端 。 然 后 子 进程 调用 ”dup2， 使 其 标准 输入 成 为 
管道 的 读 端 。 当 执行 分 页 程序 时 ， 其 标准 输入 将 是 管道 的 读 端 。 

将 一 个 描述 符 复 制 到 另 一 个 上 《在 子 进程 中 ，fd[0] 复 制 到 标准 输 
A) ， 在 复制 之 前 应 当 比 较 该 描述 符 的 值 是 人 否 已 经 具有 所 和 希望 的 值 。 如 
果 该 描述 符 已 经 具有 所 和 希望 的 值 ， 并 且 调 用 了 dup2 和 close， 那 么 该 描述 
符 的 副本 将 关闭 。【〔 回 忆 3.12 节 中 所 述 ， 当 dup2 中 的 两 个 参数 值 相等 时 
的 操作 。) 在 本 程序 中 ， 如 果 shell 没 有 打开 标准 输入 ， 那 么 程序 开始 处 
的 fopen 应 已 使 用 描述 符 0， 也 就 是 最 小 未 使 用 的 描述 符 ， 所 以 fd[0] 雇 不 
会 等 于 标准 输入 。 尽 管 如 此 ， 无 论 何 时 调用 dup2 和 close 将 一 个 描述 符 
a 
AT LE RE 

请 注意， 我 们 是 如 何尝 试 使 用 环境 变量 PAGER 获得 用 户 分 页 程序 
名 称 的 。 如 果 这 种 操作 没有 成 功 ， 则 使 用 系统 默认 值 。 这 是 环境 变量 的 














常见 用 法 。 

实例 

回忆 8.9 节 中 的 5 个 函数 : TELL_WAIT、TELL _PARENT、 
TELL_CHILD、WAIT_PARENT 和 WAIT_CHILD。 图 10-24 中 提供 了 一 
个 使 用 信号 的 实现 。 图 15-7 则 提供 了 一 个 使 用 管道 的 实现 。 





finclude "apue.h" 


static int pfdl[2], pfd2(2]; 


void 
TELL WAIT (void) 
| 
if (pipe(pfdl) < 0 || pipe(pfd2) < 0) 
err_sys("pipe error"); 


void 
TELL PARENT (pid t pid) 
| 
if (write(pfd2(1], "c", 1) != 1) 


err sys("write error"); 


void 
WAIT PARENT (void) 
{ 


char œ 


if (read(pfdl[0], &c, 1) != 1) 
err_sys("read error"); 


1f (c te tot) 
err quit ("WAIT PARENT: incorrect data"); 


void 
TELL CHILD (pid t pid) 
{ 
if (Write(pfdl[1]，"p" 1) != 1) 
err sys ("write error"); 


void 
WAIT CHILD (void) 
{ 


char (oh 


if (read(pfd2[0], &c, 1) != 1) 
err sys ("read error"); 


i fo. =e 
err quit ("WAIT CHILD: incorrect data"); 














图 15-7 让 父 进程 和 子 进 程 同步 的 例 程 
如 图 15-8 中 所 示 ， 我 们 在 调用 fork 之 前 创建 了 两 个 管道 。 父 进程 在 
调用 TELL_CHILD 时 ， 经 由 上 一 个 管道 写 一 个 字符 “p”， 子 进程 在 调用 
TELL_PARENT 时 ， 经 由 下 一 个 管道 写 一 个 字符 “c”?。 相 应 的 
WAIT_XXX 函 数 调 用 read 读 一 个 学 符 ， 没 有 读 到 学 得 时 则 阻塞 休眠 罕 
待 ) 。 











父 进 程 子 进 程 
pfdl[1] pfd1[0] 


pfd2[0] pfd2[1] 











图 15-8 用 两 个 管道 实现 父 进程 和 子 进 程 同步 
注意 ， 每 一 个 管道 都 有 一 个 额外 的 读 取 进程 ， 这 没有 关系 。 也 束 是 
说 ， 除 了 子 进程 从 pfd1[0] 读 取 ， 父 进程 也 有 上 一 个 管道 的 读 端 。 因 为 父 
进程 并 没有 执行 对 该 管道 的 读 操作 ， 所 以 这 不 会 影响 我 们 。 





15.3 册 数 popen 各 pclose 


第 见 的 操作 是 创建 一 个 连接 到 另 一 个 进程 的 管道 ， 然 后 读 其 输出 或 
向 其 输入 端 发 送 数据 ， 为 此 ， 标 准 IO 库 提供 了 两 个 函数 popen 和 
pclose。 这 两 个 函数 实现 的 操作 是 : 创建 一 个 管道 ， fork 一 个 子 进程 ， 
关闭 未 使 用 的 管道 端 ， 执 行 一 个 shell 运 行 命令 ， 然 后 等 待命 令 终 止 。 

#include <stdio.h> 

FILE *popen(const char *cmdstring, const char *type); 

返回 值 : 大 成 功 ， 返 回 文件 指针 ;大 出 错 ， 返 回 NULL 
int pclose(FILE *fp); 
返回 值 ， 若 成 功 ， 返 回 cmdstring 的 终止 状态 ; 若 出 错 ， 返 回 -1 

函数 popen 先 执行 fork， 然 后 调用 exec 执 行 cmdstring， 并 且 返 回 一 个 
标准 IO 文件 指针 。 如 果 type 是 上"， 则 文件 指针 连接 到 cmdstring 的 标准 输 
出 《上 见 图 15-9) 。 

如 果 type 是 "w"， 则 文件 指针 连接 到 cmdstring 的 标准 输入 ， 如 图 15- 
10 所 示 。 


父 进程 cmdstring ( 子 进程 ) 


图 15-9 执行 fp = popen 
(cmdstring, "r") 的 结果 


父 进程 cmdstring ( 子 进程 ) 


图 15-10 执行 fp = popen 
(cmdstring, "w") 的 结果 
有 一 BE Le eat eh 个 参数 及 其 作用 ， 
就 是 与 fopen 进 行 类 比 。 如 果 type 是 "r"， 则 返回 的 文件 指针 是 可 读 的 ， 
果 type 是 "w"， 则 是 可 写 的 。 
pclose ek 数 关闭 标准 IO 流 ， 等 待命 令 终 止 ， 然 后 返回 shell 的 终止 状 


态 。《 我 们 曾 在 8.6 节 中 摘 述 过 终止 状态 ，8.13 WRA system 函数 也 
返回 终止 状态 。) 如 果 shell 不 能 被 执行 ， 则 pclose 返 回 的 终止 状态 与 
shell 已 执行 exit(127) 一 样 。 
cmdstring 由 Bourne shell 以 下 列 方式 执行 : 
sh -c cmdstring 
这 表示 shell 将 扩展 cmdstring 中 的 任何 特殊 字符 。 例 如 ， 可 以 使 用 : 
fp = popen("ls *.c" , "r"); 
或 者 
fp = popen("cmd 2>&1" , "r"); 
实例 
用 popen 重 写 图 15-6 中 的 程序 ， 其 结果 如 图 15-11 所 示 。 


tinclude "apue ,hn 
村 nclude <sys/wait.h> 


#define PAGER  "S${PAGER:-more}" /* environment variable, or default */ 


int 


main(int argc, char *argv[]) 


char line [MAXLINE] ; 
FILE *fpin, *fpout; 


1f (arge != 2) 
err quit ("usage: a.out <pathname>"); 
if ((fpin = fopen(argv{1], "r")) == NULL) 
err sys("can't open 5s", argv(1]); 


if ((fpout = popen (PAGER, "w")) == NULL) 
err sys("popen error"); 


/* copy argv[1] to pager */ 
while (fgets (line, MAXLINE, fpin) != NULL) { 
if (fputs(line, fpout) == EOF) 
err sys("fputs error to pipe"); 
if (ferror (fpin)) 
err sys ("fgets error"); 
if (pclose(fpout) == -1) 
err sys("pclose error"); 


exit (0); 





图 15-11 用 popen 向 分 页 程序 传送 文件 
使 用 popen 减 少 了 需要 编写 的 代码 量 。 
shell 命 令 ${PAGER:-more} 的 意思 是 : 如 果 shell 变 量 PAGER 已 经 定 
义 ， 且 其 值 非 空 ， 则 使 用 其 值 ， 否 则 使 用 字符 串 more。 


实例 : 函数 popen 和 pclose 
图 15-12 中 的 程序 是 我 们 编写 的 popen 和 pclose。 


tinclude "apue,h" 
include <errno,h> 


#include <fent],h> 
finclude <sys/wait.h> 











/* 

* Pointer to array allocated at run-time, 
ay 

static pidt *childpid = NULL; 


/* 

* From our open max(), {Figure 2,17}. 
ji 

static int maxfd; 

FILE * 


popen (const char *cmdstring, const char *type) 


| 


int 12 


int pfd[2]; 
pide pid; 
FILE bale 2 S95 


/* only allow "x" or "w" */ 

if ((type[0] != 'r' && type[0] != 'w') || type[1] != 0) { 
errno = EINVAL; 
return (NULL); 


if (childpid == NULL) { /* first time through */ 
/* allocate zeroed out array for child pids */ 
maxfd = open_max(); 
if ((childpid = calloc(maxfd, sizeof(pid_t))) == NULL) 
return (NULL) ; 


if (pipe(pfd) < 0) 
return (NULL); /* errno set by pipe() */ 
if (pfd[0] >= maxfd || pfd[1] >= maxfd) { 
close (pfd[0]); 
close (pfd[1]); 
errno = EMFILE; 
return (NULL) ; 


TE Cipid = FoR < Of Å 
return (NULL); /* errno set by fork() */ 


} else if (pid == 0) { /* Ghald */ 
if (*type: == '"r") {f 
close (pfd[0]); 
if (pfd[1] != STDOUT_FILENO) { 


dup2 (pfd[1], STDOUT_FILENO) ; 
close (pfd[1]); 

} 

} else { 

close (pfd[1]); 

if (pfd[0] != STDIN_FILENO) { 
dup2 (pfd[0], STDIN_FILENO) ; 
close (pfd[0]); 


/* close all descriptors in childpid[] */ 
for (i = 0; i < maxfd; i++) 
af (childpadia] > 0) 
close(i); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 


_exit(127); 


/* parent continues... */ 
if (*type == 'r') { 


15.3 K% popen 和 pclose 
close (pfd[1]); 


if ((fp = fdopen(pfd[0], type)) == NULL) 
return (NULL) ; 
} else { 
close (pfd[0]); 
if ((fp = fdopen(pfd[1], type)) == NULL) 


return (NULL); 


childpid[fileno(fp)] = pid; /* remember child pid for this fd */ 
return (fp); 


int 

pclose (FILE *fp) 

{ 
int fd, stat; 
pid t pid; 


if (childpid == NULL) { 
errno = EINVAL; 
return (-1); /* popen() has never been called */ 


fd = fileno(fp); 
if (fd >= maxfd) { 
errno = EINVAL; 


return (-1); /* invalid file descriptor */ 
} 
if ((pid = childpid[fd]) == 0) { 
errno = EINVAL; 
return (-1); /* fp wasn't opened by popen() */ 


childpid[fd] = 0; 
if (fclose(fp) == EOF) 
return (-1); 


while (waitpid(pid, &stat, 0) < 0) 
if (errno != EINTR) 
return (-1); /* error other than EINTR from waitpid() */ 


return (stat); /* return child's termination status */ 


图 15-12 popen 函 数 和 pclose 函 数 

虽然 popen 的 核心 部 分 与 本 章 中 前 面 用 过 的 代码 类 似 ， 但 是 增加 了 
很 多 需要 考虑 的 细节 。 首 先 ， 每 次 调用 popen 时 ， 应 当 记 住所 创建 的 子 
进程 的 进程 ID， 以 及 其 文件 摘 述 符 或 FILE 指 针 。 我 们 选择 在 数组 
childpid 中 保存 子 进程 ID， 并 用 文件 摘 述 符 作 为 其 下 标 。 于 是 ， 当 以 
FILE 指 针 作 为 参数 调用 pclose 时 ， 调 用 标准 MO 函数 fileno 得 到 文件 描述 
符 ， 然 后 取得 子 进 程 ID， 并 用 其 作为 参数 调用 waitpid。 因 为 一 个 进程 可 
能 调用 popen 多 次 ， 所 以 在 动态 分 配 childpid 数 组 时 (第 一 次 调用 popen 
时 ) ， 其 数组 长 度 应 当 是 最 大 文件 描述 符 数 ， 于 是 该 数组 中 可 以 存放 与 
最 大 文件 描述 符 数 相同 的 子 进程 ID 数 。 

注意 ， 图 2-17 中 的 open_max 函 数 可 以 返回 打开 文件 的 最 大 个 数 的 近 
似 值 ， 如 果 这 个 值 与 系统 不 相关 的 话 。 注 意 不 要 使 用 那 种 其 值 大 于 (或 
等 于 ) open_max 函 数 返 回 值 的 管道 文件 描述 符 。 对 于 popen， 如 果 
open_max 函数 返回 的 值 恰巧 非常 小 ， 那 我 们 会 关闭 管道 文件 摘 述 符 并 
将 ermo 设 置 为 EMFILE， 以 此 表明 这 里 的 很 多 文件 描述 符 是 打开 的 ， 最 
后 返回 -1。 对 于 pclose， 如 果 对 应 于 文件 指针 参数 的 摘 述 符 比 所 期 望 的 
大 ， 则 将 errno 设 置 为 EINVAL， 并 返回 -1。 

调用 pipe 和 fork， 人 然后 为 popen 函 数 中 的 每 个 进程 复制 合适 的 描述 
符 ， 这 个 过 程 和 我 们 在 本 章 前 面 所 做 的 相 类 似 。 

POSIX.1 要 求 popen 关 闭 那 些 以 前 调用 popen 打 开 的 、 现 在 仍然 在 子 
进程 中 打开 着 的 IO 流 。 为 此 ， 在 子 进程 中 从 头 逐 个 检查 childpid 数 组 的 
各 个 元 素 ， 关 闭 仍 旧 打 开 着 的 描述 符 。 

若 pclose 的 调用 者 已 经 为 信号 SIGCHLD 设 置 了 一 个 信号 处 理 程序 ， 
则 pclose 中 的 waitpid 调 用 将 返回 一 个 错误 EINTR。 因 为 允许 调用 者 捕捉 
此 信号 〈 或 者 任何 其 他 可 能 中 断 waitpid 调 用 的 信号 ) ， 所 以 当 waitpid 被 
一 个 捕捉 到 的 信号 中 断 时 ， 我 们 只 是 再 次 调用 waitpid。 

注意 ， 如 果 应 用 程序 调用 waitpid， 并 且 获 得 了 popen 创 建 的 子 进 程 
的 退出 状态 ， 那 么 我 们 会 在 应 用 程序 调用 pclose 时 调用 waitpid， 如 果 发 
现 子 进程 己 不 再 存在 ， 将 返回 -1， 将 errno 设 置 为 ECHILD。 这 正 是 这 种 
情况 下 POSIX.1 所 要 求 的 。 

如 果 一 个 信号 中 断 了 wait，pclose 的 一 些 早期 版 本 会 返回 错误 
EINTR。pclose 的 一 些 早期 版 本 在 wait 期 间 ， 会 阻塞 或 忽略 信和 号 
SIGINT、SIGQUIT 和 SIGHUP。 这 是 POSIX.1 所 不 允许 的 。 

注意 ，popen 决 不 应 由 设置 用 户 ID 或 设置 组 ID 程序 调用 。 当 它 执 行 
命令 时 ，popen 等 同 于 : 

execl("/bin/sh", "sh", "-c", command, NULL); 

它 在 从 调用 者 继承 的 环境 中 执行 shell， 并 由 shell 解 释 执行 

















command。 一 个 恶意 用 户 可 以 操控 这 种 环境 ， 使 得 shell 能 以 设置 ID 文件 
模式 所 授予 的 提升 了 的 权限 以 及 非 预 期 的 方式 执行 命令 。 

popen 特 别 适用 于 执行 简单 的 过 滤 右 程序 ， 它 变换 运行 命令 的 输入 
oy fle ia 造 它 自己 的 管道 时 ， 就 是 这 种 情形 。 

SEB 

考虑 一 个 应 用 程序 ， 它 向 标准 输出 写 一 个 提示 ， 然 后 从 标准 输入 读 
1 行 。 使 用 popen， 可 以 在 应 用 程序 和 输入 之 间 插 入 一 个 程序 以 便 对 输入 
进行 变换 处 理 。 图 15-13 显 示 了 这 种 情况 下 的 进程 安排 。 


父 进程 过 滤器 程序 














stdout 


stdout stdin 






































图 15-13 用 popen 对 输入 进行 变换 处 理 

对 输入 进行 的 变换 可 能 是 路 径 名 扩充 ， 或 者 是 提供 一 种 历史 机 制 
( 记 住 以 前 输入 的 他 他) 

图 15-14 是 一 个 简单 的 用 于 演示 这 个 操作 的 过 滤 程 序 。 它 将 标准 输 
A si 在 复制 时 将 大 写字 符 变 换 为 小 写字 符 。 在 写 完 换 行 
符 之 后 

要 仔细 冲洗 (用 fflush)〉 标准 输出 ， 这 样 做 的 理由 将 在 下 一 节 介 绍 
协同 进程 时 讨论 。 











finclude "apue.h" 
finclude <ctype.h> 


int 
main (void) 
| 


int ce 


while ((c = getchar()) != BOF) | 
if (1supper (c) ) 
c = tolower(c) ; 
if (putchar(c) == EOF) 
err sys("output error"); 
if (c == '\n') 
fflush(stdout) ; 
} 
exit (0); 








图 15-14 将 大 写字 符 变 换 成 小 写字 符 的 过 滤 程 序 
将 这 个 过 滤 程 序 编译 成 可 执行 文件 nyuclc， 然 后 图 15-15 的 程序 会 
用 popen 调 用 它 。 





tinclude "apue ,hm 
finclude <sys/wait.h> 


int 

main (void) 

| 
char line[MAXLINE]; 
FILE = * fin; 


if ((fpin = popen("myuclc", "r")) == NULL) 
err sys("popen error"); 
for (i 7) { 
fputs("prompt> ", stdout); 
fflush (stdout) ; 
if (fgets(line, MAXLINE, fpin) == NULL) /* read from pipe */ 
break; 
if (fputs(line, stdout) == EOF) 
err_sys("fputs error to pipe"); 
if (pclose(fpin) == -1) 
err_sys("pclose error"); 
putchar('\n'); 
exit (0); 





图 15-15 调用 大 写 / 小 写 过 滤 程 序 读 取 命 令 
因为 标准 输出 通常 是 行 缓冲 的 ， 而 提示 并 不 包含 换行 符 ， 所 以 在 写 
了 提示 之 后 ， 需 要 调用 fflush。 


15.4 协同 进程 


UNIX 系 统 过 滤 程 序 从 标准 输入 读 取 数 据 ， 回 标准 输出 写 数据 。 几 
个 过 滤 程 序 通常 在 shell 管 道中 线性 连接 。 当 一 个 过 滤 程 序 既 产生 某 个 过 
滤 程 序 的 输入 ， 又 读 取 该 过 滤 程 序 的 输出 时 ， 它 就 变 成 了 协同 进程 

(coprocess) 。 

Korn shell 提 供 了 协同 进程 [Bolsky and Korn 1995]。Bourne shell、 
Bourne-again shell 和 C shell 并 没有 提供 将 进程 连接 成 协同 进程 的 方法 。 
协同 进程 通常 在 shell 的 后 台 运 行 ， 其 标准 输入 和 标准 输出 通过 管道 连接 

到 另 一 个 程序 。 虽 然 初 始 化 一 个 协同 进程 ， 并 将 其 输入 和 输出 连接 到 另 
一 个 进程 的 shell 语 法 是 十 分 奇特 的 (详细 情况 见 Bolsky 和 Korn[1995] 中 
mes 但 是 协同 进程 的 工作 方式 在 C 程 序 中 也 是 非常 有 用 

popen 只 提供 连接 到 男 一 个 进程 的 标准 输入 或 标准 输出 的 一 个 单 问 
管道 ， 而 协同 进程 则 有 连接 到 男 一 个 进程 的 两 个 单 同 管道 : 一 个 接 到 其 
标准 输入 ， 另 一 个 则 来 自 其 标准 输出 。 我 们 想 将 数据 写 到 其 标准 输入 ， 
CE 

KH 

让 我 们 通过 一 个 实例 来 观察 协同 进程 。 进 程 创 建 两 个 管道 : 一 个 是 
协同 进程 的 标准 输入 ， 男 一 个 是 协同 进程 的 标准 输出 。 图 15-16 显 示 了 
这 种 安排 。 























父 进程 子 进程 ( 协同 进程 ) 
fdir] stdin 


fd2[0] mA stdout 




















图 15-16 通过 写 协同 进程 的 标准 输入 和 读 取 它 的 标准 输出 来 驱动 协同 进程 

图 15-17 中 的 程序 是 一 个 简单 的 协同 进程 ， 它 从 其 标准 输入 读 取 两 

个 数 ， 计 算 它们 的 和 ， 然 后 将 和 写 至 其 标准 输出 。 协同 进程 通常 会 做 

较 此 更 有 意义 的 工作 。 设 计 本 实例 的 目的 是 帮助 了 解 将 进程 连接 起 来 所 
需 的 各 种 省 道 设施 。) 

















#include "apue.h" 


int 

main (void) 

| 
int by dtl, ts 
char line[MAXLINE],; 


while ((n = read(STDIN FILENO, line, MAXLINE)) > 0) { 
line(n} = 0; /* null terminate */ 
if (sscanf(line, "dsd", &intl, &int2) == 2) { 
sprintf (line, "$d\n", intl + int2); 
n = strlen(line); 
if (write (STDOUT FILENO, line, n) != n) 
err sys ("write error"); 
} else { 
if (write (STDOUT FILENO, "invalid args\n", 13) != 13) 
err sys("write error"); 


exit (0); 


图 15-17 将 两 个 数 相 加 的 简单 过 滤 程 序 
对 此 程序 进行 编译 ， 将 其 可 执行 目标 代码 存 入 名 为 add2 的 文件 。 
图 15-18 中 的 程序 从 其 标准 输入 读 取 两 个 数 之 后 调用 add2 协 同 进 
程 ， 并 将 协同 进程 送 来 的 值 写 到 其 标准 输出 。 





#include "apue.h" 
static void sig_pipe(int); /* our signal handler */ 
int 


main (void) 


{ 


int As fA [Zl Ail; 

pid t pid; 

char line [MAXLINE]; 

if (signal(SIGPIPE, sig_pipe) == SIG_ERR) 


err_sys ("signal error"); 


if (pipe(fd1) < 0 || pipe(fd2) < 0) 
err_sys ("pipe error"); 


if ((pid = fork()) < 0) { 
err_sys ("fork error"); 

} else if (pid > 0) { /* parent */ 
close (fd1[0]); 
close (fd2[1]); 


while (fgets(line, MAXLINE, stdin) != NULL) { 
n = strlen (line); 
if (write(fd1[1l]; line, n) != n) 


err_sys ("write error to pipe"); 

if ((n = read(fd2[0], line, MAXLINE)) < 0) 
err_sys ("read error from pipe"); 

if (n == 0) { 
err_msg ("child closed pipe"); 


break; 
} 
line[n] = 0; /* null terminate */ 
if (fputs (line, stdout) == EOF) 


err_sys("fputs error"); 


if (ferror (stdin) ) 
err_sys ("fgets error on stdin"); 

exit (0); 

} else { /* child */ 

close (fd1[1]); 

close (fd2[0]); 

if (fd1[0] != STDIN_FILENO) { 
if (dup2(fd1[0], STDIN_FILENO) != STDIN_FILENO) 

err_sys("dup2 error to stdin"); 

close(fd1[0]); 


if (fd2[1] != STDOUT_FILENO) { 
if (dup2(fd2[1], STDOUT_FILENO) != STDOUT_FILENO) 
err_sys("dup2 error to stdout"); 
close (fd2[1]); 


if (execl("./add2", "add2", (char *)0) < 0) 
err sys("execl error"); 


exit (0); 


static void 

$19 pipe (int signo) 

| 
printf ("SIGPIPE caught\n") ; 
exit (1); 





图 15-18 驱动 add2 过 滤 程 序 的 程序 

这 个 程序 创建 了 两 个 管道 ， 父 进程 、 子 进程 各 自 关 闭 它们 不 需 使 用 
的 管道 端 。 必 须 使 用 两 个 管道 : 一 个 用 作协 同 进 程 的 标准 输入 ， 男 一 个 
则 用 作 它 的 标准 输出 。 然 后 ， 子 进程 调用 dup2 使 管道 描述 符 移 至 其 标准 
输入 和 标准 输出 ， 最 后 调用 了 execl。 

若 编 译 和 运行 图 15-18 中 的 程序 ， 它 会 按 预期 工作 。 此 外 ， 若 图 15- 
18 中 的 程序 在 等 待 输入 的 时 候 杀 死 了 add2 协 同 进 程 ， 然 后 又 输入 两 个 
数 ， 那 么 程序 对 没有 读 进 程 的 管道 进行 号 操作 时 ， 会 调用 信号 处 理 程序 
(见习 题 15.4) 。 

实例 

在 协同 进程 add2〈 见 图 15-17) 中， 我 们 故意 使 用 了 底层 W/O (UNIX 
系统 调用 ) : read 和 write。 如 果 使 用 标准 1/O 来 改写 该 协同 进程 ， 会 怎么 
RENE? 图 15-19 所 示 的 程序 就 是 改写 后 的 版 本 。 

















#include "apue ,hm 


int 


main (void) 


| 


int intl, int2; 
char line [MAXLINE] ; 


while (fgets(line, MAXLINE, stdin) != NULL) { 
if (sscanf (line, "Sdtd", Gintl, &int2) == 2) | 
if (printf ("$d\n", intl + int2) == EOF) 
err sys("printf error"); 
} else { 
if (printf ("invalid args\n") == EOF) 


err sys("printf error"); 


exit (0); 





图 15-19 将 两 个 数 相 加 的 过 滤 程 序 ， 使 用 标准 IO 
看 图 15-18 中 的 程序 调用 这 个 新 的 协同 进程 ， 则 它 不 再 工作 。 问 题 




















出 在 默认 的 标准 MO 绥 冲 机 制 上 。 当 调用 图 15-19 中 的 程序 时 ， 对 标准 输 
入 的 第 一 个 fgets 引 起 标准 1O 库 分 配 一 个 缓冲 区 ， 并 选择 缓冲 的 类 型 。 
因为 标准 输入 是 一 个 管道 ， 所 以 标准 VO 库 默认 是 全 缓冲 的 。 标 准 输出 
也 是 如 此 。 当 add2 从 其 标准 输入 读 取 而 发 生 阻塞 时 ， 图 15-18 中 的 程序 
从 管道 读 时 也 发 生 阻塞 ， 于 是 产 生 了 死 锁 。 


这 里 ， 可 以 对 将 要 运行 的 这 一 协同 进程 加 以 控制 。 我 们 可 以 修改 图 


15-19 中 的 程序 ， 在 while 循 环 之 前 加 上 下 面 4 行 : 


if (setvbuf(stdin, NULL， IOLBF, 0) != 0) 
err_sys("setvbuf error"); 
if (setvbuf(stdout, NULL, _IOLBF, 0)!= 0) 


err_sys("setvbuf error"); 

这 些 代 人 码 行使 得 : 当 有 一 行 可 用 时 ，fgets 就 返回 ， 当 输出 一 个 换行 
符 时 ，printf 立即 执行 fflush 操 作 。 对 setvbuf 进 行 的 这 些 显 式 调用 使 得 图 
15-19 中 的 程序 能 正常 工作 了 。 

如 果 不 能 修改 管道 输出 的 目标 程序 ， 则 需 使 用 其 他 技术 。 例 如 ， 如 
果 在 程序 中 使 用 awk(1) 作 为 协同 进程 〈 代 蔡 add2 程 序 ) ， 则 下 列 命令 行 
不 能 工作 : 

#! /bin/awk/ -f 

{ print $1 + $2 } 

不 能 工作 的 原因 还 是 标准 MO 的 缓冲 机 制 问 题 。 但 是 在 这 种 情况 
下 ， 无 法 改变 awk 的 工作 方式 《除非 有 awk 的 源 代 码 ) 。 我 们 不 能 修改 
awk 的 可 执行 代码 ， 于 是 也 就 不 能 更 改 处 理 其 标准 MO 缓冲 的 方式 。 

对 这 种 问题 的 一 般 解 决 方法 是 使 被 调用 《在 本 例 中 是 awk) 的 协同 
进程 认为 它 的 标准 输入 和 输出 都 被 连接 到 了 一 个 终端 。 这 使 得 协同 进程 
中 的 标准 1O 例 程 对 这 两 个 WO 流 进行 行 缓冲 ， 这 类 似 于 前 面 所 做 的 显 式 
调用 setvbuf。 第 19 半 将 用 伪 终 端 实现 这 种 方法 。 











15.5 FIFO 


FIFO 有 时 被 称 为 命名 管道 。 未 命名 的 管道 只 能 在 两 个 相关 的 进程 之 
间 使 用 ， 而 且 这 两 个 相关 的 进程 还 要 有 一 个 共同 的 创建 了 它们 的 祖先 进 
程 。 但 是 ， 通过 FIFO， 不 相关 的 进程 也 能 交换 数据 。 

第 14 章 中 已 经 提 及 FIFO 是 一 种 文件 类 型 。 通 过 stat 结 构 〈 见 4.2 节 ) 
的 st_mode 成 员 的 编码 可 以 知道 文件 是 否 是 FIFO 类 型 。 可 以 用 S_ISFIFO 
宏 对 此 进行 测试 。 
" 创建 FIFO 类 似 于 创建 文件 。 确 实 ，FIFO 的 路 径 名 存在 于 文件 系统 

#include <sys/stat.h> 

int mkfifo(const char *path, mode_t mode); 

int mkfifoat(int fd, const char *path, mode_t mode); 

两 个 函数 的 返回 值 : AKH, Belo; AB, el- 

mkfifo 函 数 中 mode 参 数 的 规格 说 明 与 open 函 数 中 mode 的 相同 〈 见 
3.3 节 ) 。 新 FIFO 的 用 户 和 组 的 所 有 权 规 则 与 4.6 节 所 述 的 相同 。 

mkfifoat 函 数 和 mkfifo 函 数 相 似 ， 但 是 mkfifoat 函 数 可 以 被 用 来 在 fd 
文件 描述 符 表 示 的 目录 相关 的 位 置 创建 一 个 FIFO。 像 其 他 *at 函 数 一 
样 ， 这 里 有 3 种 情形 : 

(1) 如 果 path 参 数 指定 的 是 绝对 路 径 名 ， 则 fd 参数 会 被 忽略 摊 ， 并 
且 mkfifoat 函 数 的 行为 和 mkfifo 关 似 。 

(2) 如 果 path 参 数 指定 的 是 相对 路 径 名 ， 则 fd 参数 是 一 个 打开 目录 
的 有 效 文件 描述 符 ， 路 径 名 和 目录 有 关 。 

(3) 如 果 path 参 数 指定 的 是 相对 路 径 名 ， 并 且 fd 参 数 有 一 个 特殊 值 
AT_ FDCWD， 则 路 径 名 以 当前 目录 开始 ，mkfifoat 和 mkfifo 类 似 。 

当 我 们 用 mkfifo 或 者 mkfifoat 创 建 FIFO 时 ， 要 用 open 来 打开 它 。 确 
实 ， 正 常 的 文件 IO 函数 〈 如 close、read、write 和 unlink) 都 需要 FIFO。 

应 用 程序 可 以 用 mknod 和 mknodat 函 数 创 建 FIFO。 因 为 POSIX.1 原 先 
并 没有 包括 mknod 函 数 ， 所 以 mkfifo 是 专门 为 POSIX.1 设 计 的 。mknod 和 
mknodat 函 数 现 在 已 包括 在 POSIX.1 的 XSI 扩 展 中 。 

POSIX. 1 也 包括 了 对 mkfifo(1) 命 令 的 文 持 。 本 书 讨论 的 4 种 平台 都 提 
供 此 命令 。 因 此 ， 可 以 用 一 条 shell 命 令 创 建 一 个 FIFO， 然 后 用 一 般 的 
shell IO 重 定向 对 其 进行 访问 。 

当 open 一 个 FIFO 时 ， 非 阻塞 标志 〈O_NONBLOCK) 会 产生 下 列 影 














响 。 

“在 一 般 情况 下 (没有 指定 O_NONBLOCK) , Ki ”open 要 阻塞 到 
某 个 其 他 进程 为 写 而 打开 这 个 FIFO 为 止 。 类 似 地 ， 只 写 open 要 阻塞 到 某 
个 其 他 进程 为 读 而 打开 它 为 止 。 

“如果 指定 了 O_NONBLOCK， 则 只 读 open 立即 返回 。 但 是 ， 如 果 
没有 进程 为 读 而 打开 一 个 FIFO， 那 么 只 写 open 将 返回 -1， 并 将 ermo 设 
置 成 ENXIO。 

AF Bie, 4 write 一 个 尚 无 进程 为 读 而 打开 的 FIFO， 则 产生 信 
号 ”SIGPIPE。 加 并 个 FIFO 的 最 局 写 进程 关闭 了 该 FIFO， 则 将 为 该 
FIFO 的 读 进 程 产生 一 个 文件 结束 标志 

一 个 给 定 的 FIFO 有 多 个 写 进程 是 常见 的 。 这 就 意味 着 ， MWANA 
望 多 个 进程 所 写 的 数据 交叉 ， 则 必须 考虑 原子 写 操 作 。 和 管道 一 样 ， 党 
量 PIPE_BUF 说 明了 可 被 原子 地 写 到 FIFO 的 最 大 数据 量 。 

FIFO 有 以 下 两 种 用 途 。 

(1) shell 命 令 使 用 FIFO 将 数据 从 一 条 管道 传送 到 另 一 条 时 ， 无 需 
创建 中 间 临 时 文件 。 

(2) 客户 进程 -服务 器 进程 应 用 程序 中 ，FIFO ”用 作 汇 聚 点 ， 在 客 
户 进 程 和 服务 器 进程 二 者 之 间 传 递 数 据 。 

我 们 各 用 一 个 实例 来 说 明 这 两 种 用 途 。 

实例 ， 用 FIFO 复 制 输 出 流 

FIFO 可 用 于 复制 一 系列 sell 命 令 中 的 输出 流 。 这 束 防 止 了 将 数据 写 
问 中 间 磁 盘 文 件 〈 类 似 于 使 用 管道 来 避免 中 间 磁 盘 文件 ) 。 但 是 不 同 的 
是 ， 管 道 只 能 用 于 两 个 进程 之 间 的 线性 连接 ， 而 FIFO 是 有 名 字 的 ， 因 此 
它 可 用 于 非 线 性 连接 。 

考虑 这 样 一 个 过 程 ， 它 需要 对 一 个 经 过 过 滤 的 输入 流 进行 两 次 处 
理 。 图 15-20 显 示 了 这 种 安排 。 
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图 15-20 对 一 个 经 过 过 滤 的 输入 流 进行 两 次 处 理 的 过 程 

使 用 FIFO 和 UNIX 程 序 tee(1) 就 可 以 实现 这 样 的 过 程 而 无 需 使 用 临时 
文件 。 (tee 程序 将 其 标准 输入 同时 复制 到 其 标准 输出 以 及 其 命令 行 中 
命名 的 文件 中 。) 

mkfifo fifol 

prog3 < fifol & 

prog1 < infile | tee fifo1 | prog2 

创建 FIFO， 然 后 在 后 台 启 动 prog3， 从 FIFO 读 数据 。 然 后 启动 
progl， 用 tee 将 其 输出 发 送 到 FIFO 和 prog2。 图 15-21 显 示 了 进程 安排 。 
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图 15-21 使 用 FIFO 和 tee 将 一 个 流 发 送 到 两 个 不 同 的 进程 
实例 : 使 用 FIFO 进 行 客户 进程 -服务 器 进程 通信 
FIFO ”的 另 一 个 用 途 是 在 客户 进程 和 服务 器 进程 之 间 传 送 数据 。 如 

果 有 一 个 服务 器 进程 ， 它 与 很 多 客户 进程 有 关 ， 每 个 客户 进程 都 可 将 其 
请 求 写 到 一 个 该 服务 器 进程 创建 的 众所周知 的 FIFO 中 (“众所周知 ”的 意 
思 是 : 所 有 需 与 服务 器 进程 联系 的 客户 进程 都 知道 该 FIFO 的 路 径 名 ) 。 
图 15-22 显 示 了 这 种 安排 。 
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图 15-22 客户 进程 用 FIFO 向 服务 器 进程 发 送 请 求 
因为 该 FIFO 有 多 个 写 进程 ， 所 以 客户 进程 发 送 给 服务 器 进程 的 请 
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在 这 种 类 型 的 客户 进程 -服务 器 进程 通信 中 使 用 FIFO 的 问题 是 : 服 
务 器 进程 如 何 将 回答 送 回 各 个 客户 进程 。 不 能 使 用 单个 FIFO， 因 为 客户 
进程 不 可 能 知道 何 时 去 读 它们 的 响应 以 及 何 时 响应 其 他 客户 进程 。 一 种 
解决 方法 是 ， 每 个 客户 进程 都 在 其 请 求 中 包含 它 的 进程 DD。 然后 服务 器 
进程 为 每 个 客户 进程 创建 一 个 FIFO， 所 使 用 的 路 径 名 是 以 客户 进程 的 进 
程 ID 为 基础 的 。 例 如 ， 服 务 器 进程 可 以 用 名 字 /tmp/serv1.XXXXX 创 建 
人 




















图 15-23 用 FIFO 进 行 客户 进程 -服务 器 进程 通信 
虽然 这 种 安排 可 以 工作 ， 但 服务 器 进程 不 能 判断 一 个 客户 进程 是 否 
骨 江 终止 ， 这 就 使 得 客户 进程 专用 FIFO 会 遗留 在 文件 系统 中 。 男 外 ， 服 





务 器 进程 还 必须 得 捕捉 SIGPIPE 信 号 ， 因 为 客户 进程 在 发 送 一 个 请 求 后 
有 可 能 没有 读 取 啊 应 就 终止 了 ， 于 是 留 下 一 个 只 有 写 进程 (服务 器 进 
RE) 而 无 读 进 程 的 客户 进程 专用 FIFO。 

按照 图 15-23 中 的 安排 ， 如 果 服 务 器 进程 以 只 读 方式 打开 众所周知 
的 FIFO (因为 它 只 需 读 该 FIFO〉， 则 每 当 客 户 进 程 个 数 从 1 变 成 0 时， 
服务 器 进程 就 将 在 FIFO 中 读 到 (read) 一 个 文件 结束 标志 。 为 使 服务 器 
进程 免 于 处 理 这 种 情况 ， 一 种 常用 的 技巧 是 使 服务 器 进程 以 读 - 写 方式 
打开 该 众所周知 的 FIFO 〈 见 习题 15.10) 。 





15.6 XSI IPC 


有 3 种 称 作 XSI IPC 的 IPC: 消息 队列 、 信 号 量 以 及 共享 存储 器 。 它 
们 之 间 有 很 多 相似 之 处 。 本 节 先 介绍 它们 相 类 似 的 特征 ， 后 面 几 节 将 说 
明 这 些 IPC 各 自 的 特殊 功能 。 

XSI IPC 函 数 是 紧密 地 基于 System V 的 IPC 函 数 的。 这 3 种 类 型 的 XSI 
IPC 源 自 于 1970 年 的 一 种 称 为 “Columbus UNIX” 的 AT&T 内 部 版 本 。 后 来 
它们 被 添加 到 System V 上 。 由 于 XSI IPC 不 使 用 文件 系统 命名 空间 ， 而 
是 构造 了 它们 自己 的 命名 空间 ， 为 此 常常 受到 批评 。 


15.6.1 标识 符 和 键 


每 个 内 核 中 的 IPC 结构 〈 消 息 队 列 、 信 和 号 量 或 共享 存储 段 ) 都 用 一 
个 非 负 整数 的 标识 符 〈identifier) 加 以 引用 。 例 如 ， 要 向 一 个 消息 队列 
发 送 消息 或 者 从 一 个 消息 队列 取消 县， 只 需要 知道 其 队列 标识 符 。 与 文 
件 描 述 符 不 同 ，IPC 标 识 符 不 是 小 的 整数 。 当 一 个 IPC 结 构 被 创建 ， 然 后 
又 被 删除 时 ， 与 这 种 结构 相关 的 标识 符 连 续 加 1， 直 至 达到 一 个 整 型 数 
的 最 大 正 值 ， 然 后 又 回转 到 0。 

标识 符 是 IPC 对 象 的 内 部 名 。 为 使 多 个 合作 进程 能 够 在 同一 IPC 对 象 
上 汇聚 ， 需 要 提供 一 个 外 部 命名 方案 。 为 此 ， 每 个 IPC 对 象 都 与 一 个 键 
(key) 相关 联 ， 将 这 个 键 作 为 该 对 象 的 外 部 名 。 

无 论 何 时 创建 IPC 结 构 〈 通 过 调用 msgget、semget 或 shmget 创 建 ) ， 
都 应 指定 一 个 键 。 这 个 键 的 数据 类 型 是 基本 系统 数据 类 型 key_t， 通 党 
在 头 文件 <sys/types.h> 中 被 定义 为 长 整 型 。 这 个 键 由 内 核 变 换 成 标识 


FF 

有 多 种 方法 使 客户 进程 和 服务 器 进程 在 同一 IPC 结 构 上 汇聚 。 

(1) 服务 器 进程 可 以 指定 键 I[PC_PRIVATE 创 建 一 个 新 IPC 结 构 ， 
将 返回 的 标识 符 存放 在 某 处 〈 如 一 个 文件 ) 以 便 客户 进程 取 用 。 键 
IPC_PRIVATE 保 证 服务 器 进程 创建 一 个 新 IPC 结 构 。 这 种 技术 的 缺点 
是 : 文件 系统 操作 需要 服务 器 进程 将 整 型 标识 符 写 到 文件 中 ， 此 后 客户 
进程 又 要 读 这 个 文件 取得 此 标识 符 。 

IPC_PRIVATE 键 也 可 用 于 父 进程 子 关系 。 父 进程 指定 
IPC_PRIVATE 创 建 一 个 新 IPC 结 构 ， 所 返回 的 标识 符 可 供 fork 后 的 子 进 
程 使 用 。 接 着 ， 子 进程 又 可 将 此 标识 符 作 为 exec 函 数 的 一 个 参数 传 给 一 




















个 新 程序 。 

(2) 可 以 在 一 个 公用 头 文件 中 定义 一 个 客户 进程 和 服务 器 进程 都 
认可 的 键 。 然 后 服务 器 进程 指定 此 键 创建 一 个 新 的 IPC 结 构 。 这 种 方法 
的 问题 是 该 键 可 能 已 与 一 个 IPC 结 构 相 结合 ， 在 此 情况 下 ，get 函 数 
(msgget. semget@shmget) 出错 返回 。 服 务 器 进程 必须 处 理 这 一 错 
误 ， 删 除 已 存在 的 IPC 结 构 ， 然 后 试 着 再 创建 它 。 

(3) 客户 进程 和 服务 器 进程 认同 一 个 路 径 名 和 项 目 ID 项目 ID 是 0 
一 255 之 间 的 字符 值 ) ， 接 着 ， 调 用 函数 ftok 将 这 两 个 值 变换 为 一 个 键 。 
然后 在 方法 (2) 中 使 用 此 键 。ftok 提 供 的 唯一 服务 就 是 由 一 个 路 径 名 和 
项 目 ID 产生 一 个 键 。 

#include <sys/ipc.h> 

key_t ftok(const char *path, int id); 

BREE: FRJ, WE; A, Gk lel(key_t)-1 
ey cen omen: 当 产 生 键 时 ， 只 使 用 id 参数 的 
氏 8 位 。 

ftok 创 建 的 键 通常 是 用 下 列 方式 构成 的 : 按 给 定 的 路 径 名 取得 其 stat 
结构 〈 见 4.2 节 ) 中 的 部 分 st_dev 和 st_ino 字 段 ， 然 后 再 将 它们 与 项 目 ID 
组 合 起 来 。 如 果 两 个 路 径 名 引用 的 是 两 个 不 同 的 文件 ， 那 么 ftok 通 常会 
为 这 两 个 路 径 名 返回 不 同 的 键 。 但 是 ， 因 为 i 节点 编号 和 键 通 常 都 存放 
在 长 整 型 中 ， 所 以 创建 键 时 可 能 会 丢失 信息 。 这 意味 着 ， 对 于 不 同文 件 
的 两 个 路 径 名 ， 如 有 果 使 用 同一 项 目 ID， 那 么 可 能 产生 相同 的 键 。 

3 个 get 函 数 (msgget、semget 和 shmget) 都 有 两 个 类 似 的 参数 : 一 
个 key 和 一 个 整 型 flag。 在 创建 新 的 IPC 结 构 ( 通 常 由 服务 器 进程 创建 ) 
时 ， 如 果 key 是 IPC_PRIVATE 或 者 和 当前 某 种 类 型 的 IPC 结 构 无 关 ， 则 
需要 指明 flag 的 IPC_CREAT 标 志 位 。 为 了 引用 一 个 现 有 队列 (通常 由 客 
户 进 程 创建 》，key 必 须 等 于 队列 创建 时 指明 的 key 的 值 ， 并 且 
IPC_CREAT 必 须 不 被 指明 。 

注意 ， 决 不 能 指定 IPC_PRIVATE 作为 键 来 引用 一 个 现 有 队列 ， 
为 这 个 特殊 的 键 值 总 是 用 于 创建 一 个 新 队列 。 为 了 引用 一 个 用 
IPC_PRIVATE 键 创 建 的 现 有 队列 ,一定 要 知道 这 个 相关 的 标识 符 ， 然 
后 在 其 他 IPC 调用 中 (如 msgsnd、msgrcv) 使 用 该 标识 符 ， 这 样 可 以 
eit get phi A. 

如 果 希 望 创建 一 个 新 的 IPC 结 构 ， 而 且 要 确保 没有 引用 具有 同一 标 
识 符 的 一 个 现 有 IPC 结 构 ， 那 么 必须 在 flag 中 同时 指定 IPC_CREAT 和 
IPC_EXCL 人 位。 这样 做 了 以 后 ， 如 果 IPC 结 构 已 经 存在 就 会 造成 出 错 ， 
返回 EEXIST (这 与 指定 了 O_CREAT 和 O_EXCL 标 志 的 open 相 类 似 〉。 








15.6.2 2 


XSI IPC 为 每 一 个 IPC 结 构 关 联 了 一 个 ipc_perm 结 构 。 该 结构 规定 了 
权限 和 所 有 者 ， 它 至 少 包括 下 列 成 员 : 
struct ipc_perm { 
uid_t uid; /* owner's effective user id */ 
gid_t gid; /* owner's effective group id */ 
uid_t cuid; /* creator's effective user id */ 
gid_t cgid; /* creator's effective group id */ 
mode_t mode; /* access modes */ 


Bo 


每 个 实现 会 包括 另外 一 些 成 员 。 如 欲 了 解 你 所 用 系统 中 它 的 完整 定 
义 ， 请 参见 <sys/ipc.h>。 

在 创建 [PC 结构 时 ， 对 所 有 字段 都 赋 初 值 。 以 后 ， 可 以 调用 
msgctl、semctl 或 shmctl 修 改 vid、gid 和 mode 字 7 段 。 为 了 修改 这 些 值 ， 调 
用 进程 必须 是 IPC 结 构 的 创建 者 或 超级 用 户 。 修 改 这 些 字 段 类 似 于 对 文 
件 调用 chown 和 chmod。 

mode 字 段 的 值 类 似 于 图 4-6 中 所 示 的 值 ， 但 是 对 于 任何 IPC 结 构 都 不 
存在 执行 权限 。 另 外 ， 消 息 队 列 和 共享 存储 使 用 术语 * 读 ”和 “* 写 ”， 而 信 
号 量 则 用 术语 “ 读 ” 和 “更 改 ”(alter) 。 图 15-24 显 示 了 每 种 IPC 的 6 种 权 
限 。 











用 户 读 
用 户 写 (更改 ) 


组 读 
组 写 ( 更 改 ) 
其 他 读 

其 他 写 (更 改 ) 


图 15-24 XSI IPC 权 限 











茶 些 实现 定义 了 表示 每 种 权限 的 符号 常量 ,但 是 这 些 常 量 并 不 包括 


在 Single UNIX Specification 中 。 
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所 有 3 种 形式 的 XSI IPC 都 有 内 置 限制 。 大 多 数 限制 可 以 通过 重新 配 
置 内 核 来 改变 。 在 对 这 3 种 形式 的 IPC 中 的 每 一 种 进行 描述 时 ， 我 们 都 会 
指出 它 的 限制 。 

在 报告 和 修改 限制 方面 ， 每 种 平台 都 有 自己 的 方法 。FreeBSD 
8.0、Linux 3.2.0 和 Mac OS X 10.6.8 提 供 了 sysctl 命 令 来 观察 和 修改 内 核 配 
置 参数 。 在 Solaris 10 中 ， 可 以 用 prctl 命 令 来 改变 内 核 IPC 的 限制 。 

在 Linux 中 ， 可 以 运行 ipcs -来 显示 IPC 相 关 的 限制 。 在 FreeBSD 
中 ， 等 效 的 命令 是 ipcs-T。 在 Solaris 中 ， 可 以 通过 运行 sysdef -y 来 找到 可 
Va SB 











15.6.4 优点 和 缺点 


XSI IPC 的 一 个 基本 问题 是 :IPC 结构 是 在 系统 范围 内 起 作用 的 ， 
没有 引用 计数 。 例 如 ， 如 果 进 程 创建 了 一 个 消息 队列 ， 并 且 在 该 队列 中 
放 入 了 几 则 消息 ， 然 后 终止 ， 那 么 该 消息 队列 及 其 内 容 不 会 被 删除 。 它 
们 会 一 直 留 在 系统 中 直至 发 生 下 列 动作 为 止 : 由 某 个 进程 调用 msgrcv 
或 msgctl 读 消 恩 或 删除 消息 队列 ; 或 某 个 进程 执行 ipcrm(1) 命 令 删 除 消息 
队列 ;或 正在 目 举 的 系统 删除 消息 队列 。 将 此 与 管道 相 比 ， 当 最 后 一 个 
引用 管道 的 进程 终止 时 ， 管 道 束 被 完全 地 删除 了 。 对 于 FIFO 而 言 ， 在 最 
后 一 个 引用 FIFO 的 进程 终止 时 ， 虽 然 FIFO 的 名 字 仍 保留 在 系统 中 ， 直 
至 被 显 式 地 删除 ， 但 是 留 在 FIFO 中 的 数据 已 被 删除 了 。 

XSI IPC 的 另 一 个 问题 是 : 这 些 IPC 结 构 在 文件 系统 中 没有 名 字 。 我 
们 不 能 用 第 3 章 和 第 4 章 中 所 述 的 函数 来 访问 它们 或 修改 它们 的 属性 。 为 
了 文 持 这 些 ITPC 对 象 ， 内 核 中 增加 了 十 几 个 全 新 的 系统 调用 (msgget、 
semop. 、shmat 等 ) 。 我 们 不 能 用 ls 命令 查看 IPC 对 象 ， 不 能 用 rm 命令 删 
除 它们 ， 也 不 能 用 chmod 命 令 修 改 它 们 的 访问 权限 。 于 是 ， 又 增加 了 两 
个 新 命令 ipcs(1) 和 ipcrm(1)。 

因为 这 些 形式 的 IPC 不 使 用 文件 描述 符 ， 所 以 不 能 对 它们 使 用 多 路 
转 接 VO 函数 (select 和 poll〉。 这 使 得 它 很 难 一 次 使 用 一 个 以 上 这 样 的 
IPC 结 构 ， 或 者 在 文件 或 设备 LO 中 使 用 这 样 的 IPC 结 构 。 例 如 ， 如 果 没 
有 某 种 形式 的 忙 等 循环 (busy-wait loop) ， 就 不 能 使 一 个 服务 器 进程 等 
符 将 要 放 在 两 个 消息 队列 中 任意 一 个 中 的 消息 。 

Andrade、Carges 和 Kovach[1989] 对 使 用 System V IPC 构 建 的 一 个 事 

















务 处 理 系 统 进行 了 综述 。 他 们 认为 System V IPC 使 用 的 命名 空间 (标识 
符 ) 是 一 个 优点 ， 而 不 是 前 面 所 说 的 问题 ， 理 由 是 使 用 标识 符 使 一 个 进 
程 只 要 使 用 单个 函数 调用 (msgsnd) 就 能 将 一 个 消息 发 送 到 一 个 队列 ， 
而 其 他 形式 的 IPC 则 通常 还 要 调用 open、write 和 close。 这 种 说 法 是 错误 
的 。 为 了 避免 使 用 键 和 调用 msgget， 客 户 进程 总 要 以 某 种 方式 获得 服务 
器 进程 队列 的 标识 符 。 分 派 给 特定 队列 的 标识 符 取 决 于 在 创建 该 队列 
时 ， 有 多 少 消息 队列 已 经 存在 ， 也 取决 于 自 内 核 自 举 以 来 ， 内 核 中 将 分 
配给 新 队列 的 表 项 已 经 使 用 了 多 少 次 。 这 是 一 个 动态 值 ， 无 法 猜 到 或 事 
先 存放 在 一 个 头 文件 中 。 正 如 15.6.1 节 所 述 ， 至 少 服务 器 进程 应 将 分 配 
给 队列 的 标识 符 写 到 一 个 文件 中 以 便 客户 进程 读 取 。 

这 些 作 者 列举 的 消息 队列 的 其 他 优点 是 : 它们 是 可 靠 的 、 流 控制 的 
以 及 面向 记录 的 ; 它们 可 以 用 非 先 进 先 出 次 序 处 理 。 图 15-25 对 这 些 不 
同形 式 IPC 的 某 些 特征 进行 了 比较 。 
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图 15-25 不 同形 式 IPC 之 间 的 特征 比较 

(我 们 将 在 第 16 章 中 描述 流 和 数据 报 套 接 字 ， 在 17.2 节 中 描述 
UNIX 域 套 接 字 。) 图 15-25 中 的 “无 连接 ” 指 的 是 无 需 先 调 用 某 种 形式 
的 打开 函数 就 能 发 送 消息 的 能 力 。 如 前 所 述 ， 因 为 需要 有 某 种 技术 来 获 
得 队列 标识 符 ， 所 以 我 们 并 不 认为 消息 队列 是 无 连接 的 。 因 为 所 有 这 些 
形式 的 IPC 被 限制 在 一 台 主 机 上 ， 所 以 它们 都 是 可 靠 的 。 当 消息 通过 网 
络 传送 时 ， 就 要 考虑 丢失 消息 的 可 能 性 。“* 流 控制 ?的 意思 是 : 如 果 系 统 
资源 ( 绥 冲 区 ) 短缺 ， 或 者 如 果 接 收 进 程 不 能 再 接收 更 多 消息 ， 则 发 送 
进程 就 要 休眠 。 当 流 控制 条 件 消 失 时 ， 发 送 进程 应 自动 唤醒 。 

图 15-25 中 没有 显示 的 一 个 特征 是 : IPC 设施 能 否 自动 地 为 每 个 客 
户 进程 创建 一 个 到 服务 器 进程 的 唯一 连接 。 第 17 章 将 说 明 UNIX 流 套 接 
ONR E E IPC 进 行 详 细 的 描 
Ko 








15.7 消 居 队列 


消 妃 队列 是 消息 的 链接 表 ， 存 储 在 内 核 中 ， 由 消 县 队列 标识 符 标 
识 。 在 本 节 中 ， 我 们 把 消息 队列 简称 为 队列 ， 其 标识 符 简 称 为 队列 ID。 

Single UNIX Specification 的 消息 传送 选项 中 包括 一 种 替代 的 IPC 消 
息 队 列 接口 ， 该 接口 来 源 于 POSIX 实 时 扩展 。 本 书 不 讨论 这 个 接口 。 

msgget 用 于 创建 一 个 新 队列 或 打开 一 个 现 有 队列 。msgsnd 将 新 消 
息 添加 到 队列 尾 端 。 每 个 消息 包含 一 个 正 的 长 整 型 类 型 的 字段 、 一 个 非 
负 的 长 度 以 及 实际 数据 字 节 数 (对 应 于 长 度 ) ， 所 有 这 些 都 在 将 消息 添 
加 到 队列 时 ， 传 送 给 msgsnd。msgrcv 用 于 从 队列 中 取消 息 。 我 们 并 不 
一 定 要 以 先进 先 出 次 序 取消 轧 ， 也 可 以 按 消 息 的 类 型 字段 取消 息 。 

每 个 队列 都 有 一 个 msqid_ds 结 构 与 其 相关 联 : 

struct msqid_ds { 























struct ipc_perm msg_perm; /* see Section 15.6.2 */ 

msgqnum_t msg_qnum; /* # of messages 
on queue */ 

msglen_t msg_qbytes; /* max # of bytes on 
queue */ 

pid_t msg_Ispid; /* pid of last 
msgsnd() */ 

pid_t msg_Irpid; /* pid of last 
msgrcv() */ 

time_t msg_stime; /* last-msgsnd() time 
*/ 

time_t msg_rtime; /* last-msgrcv() time 
*/ 

time_t msg_ctime; /* last-change time */ 


ie 

此 结构 定义 了 队列 的 当前 状态 。 结 构 中 所 示 的 各 成 员 是 由 Single 
UNIX Specification 定 义 的 。 有 具体 实现 可 能 包括 标准 中 没有 定义 的 另 一 些 
字段 。 

图 15-26 列 出 了 影响 消息 队列 的 系统 限制 。“ 导 出 的 ”表示 这 种 限制 
来 源 于 其 他 限制 。 例 如 ， 在 Linux 系 统 中 ， 最 大 消息 数 是 根据 最 大 队列 











数 和 队列 中 所 允许 的 最 大 数据 量 来 决定 的 。 其 中 最 大 队列 数 还 要 根据 系 
统 上 安装 的 RAM 的 数量 来 决定 。 注 意 ， 队 列 的 最 大 字 节 数 限 制 进一步 
限制 了 队列 中 将 要 存储 的 消息 的 最 大 长 度 。 

调用 的 第 一 个 函数 通常 是 msgget， 其 功能 是 打开 一 个 现 有 队列 或 创 
建 一 个 新 队列 。 


典型 人 


FreeBSD 8.0 | Linux 3.2.0 | MacOSX10.68 | Solaris 10 


Al i Ae A ENTIM 

个 将 足 队列 的 最 大 字 节 数 ( 亦 即 队 
列 中 所 有 消息 长 度 之 和 ) 
系统 中 最 大 消息 队列 数 
系统 中 最 大 消息 数 














图 15-26 影响 消息 队列 的 系统 限制 
#include <sys/msg.h> 
int msgget(key_t key, int flag); 
返回 值 : 知 成 功 ， 返 回 消息 队列 ID; 辱 出 错 ， 返 回 -1 

15.6.1 市 说 明了 将 key 变 换 成 一 个 标识 符 的 规则 ， 并 且 讨 论 了 是 创建 
一 个 新 队列 还 是 引用 一 个 现 有 队列 。 在 创建 新 队列 时 ， 要 初始 化 msqid- 
ds 结构 的 下 列 成 员 。 

“ipc-perm 结 构 按 15.6.2 节 中 所 述 进行 初始 化 。 访 结构 中 的 mode 成 员 
按 fag 中 的 相应 权限 位 设置 。 这 些 权限 用 图 15-24 中 的 值 指定 。 

msg_qnum、msg_lspid、msg_lrpid、msg_stime 和 msg_rtime 都 设置 
为 0。 

“msg_ctime 设 置 为 当前 时 间 。 

msg_gbytes 设 置 为 系统 限制 值 。 

各 执行 成 功 ，msgget 返 回 非 负 队列 ID。 此 后 ， 该 值 就 可 被 用 于 其 他 
3 个 消息 队列 函数 。 

msgctl 函 数 对 队列 执行 多 种 操作 。 它 和 另外 两 个 与 信号 量 及 共享 存 
储 有 关 的 函数 〈semctt 和 shmctl) 都 是 XSI ”IPC 的 类 似 于 ioctl 的 函数 〈 亦 
即 垃圾 桶 函数 ) 。 


#include <sys/msg.h> 


int msgctl(int msqid, int cmd, struct msqid_ds *buf); 
返回 值 : ERJ, EO; 大 出 错 ， 返 回 -1 
cmd 参 数 指定 对 msqid 指 定 的 队列 要 执行 的 命令 。 

IPC_STAT 取 此 队列 的 msqid_ds 结 构 ， 并 将 它 存 放 在 buf 指 向 的 结构 
中 

IPC_SET 将 字段 msg_perm.uid、msg_perm.gid、msg_perm.mode 和 
msg_qbytes 从 buf 指 同 的 结构 复制 到 与 这 个 队列 相关 的 msqid_ds 结 构 中 。 
此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 
msg_perm.cuid 或 msg_perm.uid， 另 一 种 是 具有 超级 用 户 特权 的 进程 。 只 
有 超级 用 户 才能 增加 msg_qbytes 的 值 。 

IPC_RMID ”从 系统 中 删除 该 消息 队列 以 及 仍 在 该 队列 中 的 所 有 数 
据 。 这 种 删除 立即 生效 。 仍 在 使 用 这 一 消息 队列 的 其 他 进程 在 它们 下 一 
次 试图 对 此 队列 进行 操作 时 ， 将 得 到 EIDRM 错 误 。 此 命令 只 能 由 下 列 
两 种 进程 执行 :一 种 是 其 有 效用 户 ID 等 于 msg_perm.cuid 或 
msg_perm.uid; 男 一 种 是 具有 超级 用 户 特 权 的 进程 。 

这 3 条 命令 (IPC_STAT、IPC_SET 和 IPC_RMID) 也 可 用 于 信号 量 
MEEF. 

调用 msgsnd 将 数据 放 到 消 明 队列 中 。 

#include <sys/msg.h> 

int msgsnd(int msqid, const void *ptr, size_t nbytes, int flag); 

返回 值 : ERJ, BRE; 大 出 错 ， 返 回 -1 

正如 前 面 提 及 的 ， 每 个 消息 都 由 3 部 分 组 成 : 一 个 正 的 长 整 型 类 型 
的 字段 、 一 个 非 负 的 长 度 bytes) 以 及 实际 数据 字 节 数 〈 对 应 于 长 
FED 。 消 妃 总 是 放 在 队列 尾 端 。 

ptr 参 数 指 同一 个 长 整 型 数 ， 它 包含 了 正 的 整 型 消息 类 型 ， 其 后 紧 接 
着 的 是 消息 数据 《各 nbytes 是 0(， 则 无 消息 数据 ) 。 奋 发 送 的 最 长 消息 是 
512 字 市 的 ， 则 可 定义 下 列 结构 : 

struct mymesg { 

long mtype; /* positive message type */ 
char mtext[512]; /* message data, of length nbytes */ 


}; 

ptr 就 是 一 个 指 癌 mymesg 结 构 的 指针 。 接 收 者 可 以 使 用 消息 类 型 以 
非 先进 先 出 的 次 序 取 消息 。 

某 些 平台 既 文 持 32 位 环境 ， 又 文 持 64 位 环境 。 这 影响 到 长 整 型 和 指 
针 的 大 小 。 例 如 ， 在 64 位 SPARC 系 统 中 ，Solaris 人 允许 32 位 应 用 程序 和 64 
位 应 用 程序 同时 存在 。 如 果 一 个 32 位 应 用 程序 要 经 由 管道 或 套 接 字 与 一 
个 64 位 应 用 程序 交换 此 结构 ， 束 会 出 问题 。 因 为 在 32 位 应 用 程序 中 ， 长 























整 型 的 大 小 是 4 字 节 ， 而 在 64 位 应 用 程序 中 ， 长 整 型 的 大 小 是 8 字 节 。 这 
意味 着 ，32 位 应 用 程序 期 望 mtext 字 段 在 结构 起 始 地 址 后 的 第 4 个 字 节 处 
开始 ， 而 64 位 应 用 程序 则 期 望 mtext 字 段 在 结构 起 始 地 址 后 的 第 8 个 字 节 
处 开始 。 在 这 种 情况 下 ，64 位 应 用 程序 的 mtype 字 段 的 一 部 分 会 被 32 位 
应 用 程序 视 为 mtext 字 段 的 组 成 部 分 ， 而 32 位 应 用 程序 的 mtext 字 段 的 前 4 
个 字 节 会 被 64 位 应 用 程序 解释 为 mtype 字 段 的 组 成 部 分 。 

但 是 ，XSI 消 息 队 列 就 不 会 发 生 这 种 问题 。Solaris 实 现 的 IPC 系 统 调 
用 的 32 位 版 本 和 64 位 版 本 具有 不 同 的 入 口 点 。 这 些 系 统 调用 知道 如 何 处 
理 32 位 应 用 程序 与 64 位 应 用 程序 的 通信 操作 ， 并 对 类 型 字段 做 了 特殊 处 
理 以 避免 它 干 扰 消 息 的 数据 部 分 。 唯 一 的 潜在 问题 是 ， 当 64 位 应 用 程序 
向 32 位 应 用 程序 发 送 消息 时 ， 如 果 它 在 8 字 节 类 型 字段 中 设置 的 值 大 于 
32 位 应 用 程序 中 4 字 节 类 型 字段 可 表示 的 值 ， 那 么 32 位 应 用 程序 在 其 
mtype 字 段 中 得 到 的 将 是 一 个 截 短 了 的 类 型 值 。 

参数 flag 的 值 可 以 指定 为 IPC_NOWAIT。 这 类 似 于 文件 WO 的 非 阻塞 
1O 标 志 ( 见 14.2 节 ) 。 若 消息 队列 已 满 (或 者 是 队列 中 的 消息 总 数 等 于 
系统 限制 值 ， 或 队列 中 的 字 节 总 数 等 于 系统 限制 值 ) ， 则 指定 
IPC_NOWAIT 使 得 msgsnd 立 即 出 错 返回 EAGAIN。 如 果 没 有 指定 
IPC_NOWAIT， 则 进程 会 一 直 阻 塞 到 : 有 衬 间 可 以 容纳 要 发 送 的 消息 ; 
或 者 从 系统 中 删除 了 此 队列 ; 或 者 捕捉 到 一 个 信号 ， 并 从 信号 处 理 程序 
返回 。 在 第 二 种 情况 下 ， 会 返回 EIDRM 错 误 (“标识 符 被 删除 ”) 。 最 后 
一 种 情况 则 返回 EINTR 错 误 。 

注意 ， 对 删除 消息 队列 的 处 理 不 是 很 完善 。 因 为 每 个 消息 队列 没有 
维护 引用 计数 器 (打开 文件 有 这 种 计数 器 ) ， 所 以 在 队列 被 删除 以 后 ， 
仍 在 使 用 这 一 队列 的 进程 在 下 次 对 队列 进行 操作 时 会 出 错 返 回 。 信 号 量 
机 构 也 以 同样 方式 处 理 其 删除 。 相 反 ， 删 除 一 个 文件 时 ， 要 等 到 使 用 该 
文件 的 最 后 一 个 进程 关闭 了 它 的 文件 描述 符 以 后 ， 才 能 删除 文件 中 的 内 


合 。 

当 msgsnd 返 回 成 功 时 ， 消 息 队 列 相 关 的 msqid_ds 结 构 会 随 之 更 新 ， 
表明 调用 的 进程 ID (msg lspid) 、 调 用 的 时 间 Cmsg_stime) 以 及 队列 
Hr AYA. (msg qnum) 。 

msgrcv A BAA PALE So 

#include <sys/msg.h> 

ssize_t msgrcv(int msgid, void *ptr, size_t nbytes, long type, int flag); 

返回 值 : ARJ, GRA BBO IR RE; tne, GR IBI-1 

和 msgsnd 一 样 ，ptr 参 数 指 同一 个 长 整 型 数 〈 其 中 存储 的 是 返回 的 消 
轧 类 型 ) ， 其 后 跟随 的 是 存储 实际 消 轧 数据 的 缓冲 区 。nbytes 指定 数据 
缓冲 区 的 长 度 。 奉 返回 的 消息 长 度 大 于 ”nbytes， 而 且 在 flag 中 设置 了 





























MSG_NOERROR 位 ， 则 该 消息 会 被 截断 〈 在 这 种 情况 下 ， 没 有 通知 告 
消息 被 截 去 的 部 分 被 丢弃 ) 。 如 果 没 有 设置 这 一 标 
志 ， 而 消息 又 太 长 ， 则 出 错 返 回 E2BIG (消息 仍 留 在 队列 中 〉。 

参数 type 可 以 指定 想 要 哪 一 种 消息 。 

type == 0 返回 队列 中 的 第 一 个 消 息 。 

type > 0 JK [FI BAS AYE E 类 型 为 type 的 第 一 个 消息 

type < 0 返回 队列 中 消息 类 型 值 小 于 等 于 type 绝对 值 的 消息 RB, WR 
这 种 消息 有 若干 个 ， 则 取 类 型 值 最 小 的 消息 。 

type 值 非 0 用 于 以 非 先进 先 出 次 序 读 消息 ，。 例如 ， 若 应 用 程序 对 消 
恩 赋 予 优先 权 ， 那 么 type 就 可 以 是 优先 权 值 。 如 果 一 个 消 恩 队列 由 多 个 
客户 进程 和 一 个 服务 器 进程 使 用 ， 那 么 type 字 段 可 以 用 来 包含 客户 进程 
的 进程 ID 〈 只 要 进程 ID 可 以 存放 在 长 整 型 中 ) 。 

可 以 将 flag 值 指定 为 IPC_NOWAIT， 使 操作 不 阻塞 ， 这 样 ， 如 果 没 
有 所 指定 类 型 的 消息 可 用 ， 则 msgrcv 返 回 -1，error 设 置 为 ENOMSG 。 如 
果 没 有 指定 IPC_NOWAIT， 则 进程 会 一 直 阻 塞 到 有 了 指定 类 型 的 消息 可 
用 ， 或 者 从 系统 中 删除 了 此 队列 《返回 -1，error 设 置 为 EIDRM) ， 或 
者 捕捉 到 一 个 信号 并 从 信号 处 理 程 序 返回 〈 这 会 导致 msgrcv 返 回 -1， 
errno 设 置 为 EINTR ) 。 

msgrcv 成 功 执 行 时 ， 内 核 会 更 新 与 该 消息 队列 相关 联 的 msgid_ds 结 
构 ， 以 指示 调用 者 的 进程 ID Cmsg_Irpid) 和 调用 时 间 (msg_rtime) ， 
并 指示 队列 中 的 消息 数 减 少 了 1 个 (msg qnum) 。 

实例 : 消息 队列 与 全 双 工 管道 的 时 间 比 较 

如 若 需 要 客户 进程 和 服务 器 进程 之 间 的 双向 数据 流 ， 可 以 使 用 消息 
人 道 。 (回忆 图 15-1， 通 过 he 见 17.2 
， 可 以 使 全 双 工 管道 可 用 ， 而 某 些 平台 通过 pipe 函 数 提 供 全 双 工 管 
) 

图 15-27 显 示 了 在 Solaris 上 3 种 技术 在 时 间 方 面 的 比较 ， 这 3 种 技术 
E: WENI ERL (STREAMS) 管道 和 UNIX 域 套 接 字 。 测 试 程序 
先 创建 ITPC 通 道 ， 调 用 fork， 然 后 从 父 进程 辣子 进程 发 送 约 200 MBL 
据 。 数 据 发 送 的 方式 是 ， 对 于 消息 队列 ， 调 用 100 ”000 次 msgsnd， 每 个 
消息 长 度 为 2 000 字 节 ; 对 于 全 双 工 管道 和 UNIX 域 套 接 字 ， 调 用 100 000 
次 write， 每 次 写 2 000 字 节 。 时 间 都 以 秒 为 单位 。 

















消息 队列 4.16 


42 OUT Fis 4.30 
UNIX 域 套 接 字 5.58 


图 15-27 在 Solaris 上 3 种 IPC 的 时 间 比 较 
从 这 些 数字 中 可 见 ， 消 息 队 列 原 来 的 实施 目的 是 提供 高 于 一 般 速 度 
的 IPC， 但 现在 与 其 他 形式 的 IPC 相 比 ， 在 速度 方面 已 经 没有 什么 差别 
了 。【〔 在 原来 实施 消息 队列 时 ， 可 用 的 其 他 形式 的 IPC 就 只 有 半 双 工 管 
道 这 一 种 。) 考虑 到 使 用 消息 队列 时 遇 到 的 问题 〈 见 15.6.4 节 ) ， 我 们 
得 出 的 结论 是 ， 在 新 的 应 用 程序 中 不 应 当 再 使 用 它们 。 








15.8 信号 量 


叶 基 与 已 经 介 绍 过 的 IPC 机 构 〈 管 道 、FIFO 以 及 消息 列队 ) 不 
als B~ 计数 器 ， 用 于 为 多 个 进程 提供 对 共享 数据 对 象 的 访问 。 

UNIX Specification Efi J 77h 套 信号 量 接口 ， 该 接口 原来 
是 实时 扩展 的 一 部 分 。 我 们 将 在 15.10 节 讨论 这 种 接口 。 

为 了 获得 共享 资源 ， 进程 需要 执行 下 列 操作 。 

(1) 测试 控制 该 资源 的 信号 量 。 

(2) 知 此 信号 量 的 值 为 正 ， 则 进程 可 以 使 用 该 资源 。 在 这 种 情况 
下 ， 进 程 会 将 信号 量 值 减 1， 表 示 它 使 用 了 一 个 资源 单位 。 

(3) 否则 ， 车 此 信号 量 的 值 为 0， 则 进程 进入 休眠 状态 ， 直 至 信 

量 值 大 于 0。 进 程 被 唤醒 后 ， 它 返回 至 步骤 (1) 。 

当 进 程 不 再 使 用 由 一 个 言 号 量 控制 的 共享 资源 时 ， Was Vei 

1。 如 果 有 进程 正在 休眠 等 待 此 信号 量 ， 则 唤醒 它们 。 
为 了 正确 地 实现 信号 量 ， 言 号 量 值 的 测试 及 减 1 操作 应 当 是 原子 操 
作 。 为 此 ， 信 号 量 通常 是 在 内 核 中 实现 的 。 
常用 的 信号 量 形式 被 称 为 二 元 信和 号 量 (binary semaphore ) 。 它 控制 
单个 资源 ， 其 初始 值 为 1。 但 是 ， 一 般 而 言 ， 信 号 量 的 初 值 可 以 是 任意 
一 个 正 值 ， 该 值 表明 有 多 少 个 共 至 资源 单位 可 供 共 至 应 用 。 
遗憾 的 是 ，XSI 信 号 量 与 此 相 比 要 复杂 得 多 。 以 下 3 种 特性 造成 了 这 

种 不 必要 的 复杂 性 。 

(1) fas 量 并 非 是 单个 非 负 值 ， 而 必需 定义 为 含有 一 个 或 多 个 信 

号 量 值 的 集合 。 当 创 建 信号 量 时 ， 要 指定 集合 中 信和 号 量 值 的 数量 。 

(2) 信和 号 量 的 创建 (semget) 是 独立 于 它 的 初始 化 (semctl) 的 。 
这 是 一 个 致命 的 缺点 ， 因 为 不 能 原子 地 创建 一 个 信号 量 集 合 ， 并 且 对 访 
集合 中 的 各 个 信号 量 值 赋 初 值 。 

(3) 即使 没有 进程 正在 使 用 各 种 形式 的 XSI IPC， 它 们 仍然 是 存在 
的 。 有 的 程序 在 终止 时 并 没有 释放 已 经 分 配给 它 的 信号 量 ， 所 以 我 们 不 
得 不 为 这 种 程序 担心 。 后 面 将 要 说 明 的 ”undo ”功能 就 是 处 理 这 种 情况 


的 。 
内 核 为 每 个 信号 量 集合 维护 着 一 个 semid_ds 结 构 : 
struct semid_ds { 
struct ipc_perm sem_perm; /* see Section 15.6.2 */ 
unsigned short sem_nsems; /* # of semaphores in set */ 




































































time_t sem_otime; /* last-semop() time */ 
time_t sem_ctime; /* last-change time */ 


Single UNIX Specification 定 义 了 上 面 所 示 的 各 字段 ， 但 是 具体 实现 
可 在 semid_ ds 结构 中 定义 添加 的 成 员 。 


每 个 信号 量 由 一 个 无 名 结构 表示 ， 它 至 少 包 含 下 列 成 员 : 
Struct { 
unsigned short semval; /* semaphore value, always >= 0 */ 
pid_t sempid; /* pid for last operation */ 
unsigned short semncnt; /*  # processes awaiting 
semval>curval */ 
unsigned short semzcnt; /* # processes awaiting semval==0 
*/ 


its. 28 列 出 了 影响 信号 量 集合 的 系统 限制 。 


任 一 信号 量 的 最 大 但 
任 一 信号 量 的 最 大 退出 时 的 调整 人 
系统 中 信 


号 量 集 的 最 大 数量 
系统 中 信号 量 的 最 大 数量 

每 个 信号 量 集中 的 信号 量 的 最 大 数量 
系统 中 undo 结构 的 最 大 数量 

每 个 undo 结构 中 undo 项 的 最 大 数量 
每 个 semop 调用 中 操作 的 最 大 数量 








图 15-28 影响 信号 量 的 系统 限制 
当 我 们 想 使 用 XSI 信 号 量 时 ， 首 先 需要 通过 调用 函数 semget 来 获得 


一 个 信号 量 ID。 





#include <sys/sem.h> 
int semget(key_t key, int nsems, int flag); 
返回 值 : ARH, Ma SID; AWE, el- 
15.6.1 节 说 明了 将 key 变 换 为 标识 符 的 规则 ， 讨 论 了 是 创建 一 个 新 集 
合 ， 还 是 引用 一 个 现 有 集合。 创建 一 个 新 集合 时 ， 要 对 semid_ds 结 构 的 
下 列 成 员 赋 初 值 。 
。 按 15.6.2 节 中 所 述 ， 初 始 化 ipc_perm 结 构 。 该 结构 中 的 mode 成 员 被 
设置 为 fag 中 的 相应 权限 位 。 这 些 权限 是 用 图 15-24 中 的 值 设置 的 。 
“sem_otime 设 置 为 0。 
“sem_ctime 设 置 为 当前 时 间 。 
“sem_nsems 设 置 为 nsems。 
nsems 是 该 集合 中 的 信号 量 数 。 如 果 是 创建 新 集合 (一 般 在 服务 器 
进程 中 ) ， 则 必须 指定 nsems。 如 果 是 引用 现 有 和 集合 (一 个 客户 进 
程 ) ， 则 将 nsems 指 定 为 0。 
semct 函数 包含 了 多 种 信号 量 操作 。 
#include <sys/sem.h> 
int semctl(int semid, int semnum, int cmd, ... /* union semun arg */); 
返回 值 ，( 见 下 ) 
第 4 个 参数 是 可 选 的 ， 是 否 使 用 取决 于 所 请 求 的 命令 ， 如 果 使 用 访 
参数 ， 则 其 类 型 是 semun， 它 是 多 个 命令 特定 参数 的 联合 Cunion) : 
union semun { 
int val; /* for SETVAL */ 
struct semid_ds *buf; /* for IPC_STAT and IPC SET */ 
unsigned short *array; /* for GETALL and SETALL */ 








ie 

注意 ， 这 个 选项 参数 是 一 个 联合 ， 而 非 指 向 联合 的 指针 。 

通常 应 用 程序 必须 定义 semun 联 合 。 然 而 ， 在 FreeBSD 8.04, 
semun 已 经 由 <sys/sem.h> 为 我 们 定义 好 了 。 

cmd 参 数 指定 下 列 10 种 命令 中 的 一 种 ， 这 些 命令 是 运行 在 semid 指 定 
的 信号 量 集 合 上 的 。 其 中 有 5 种 命令 是 针对 一 个 特定 的 信号 量 值 的 ， 它 
们 用 semnum 指 定 该 信号 量 集合 中 的 一 个 成 员 。semnum 值 在 0 和 nsems-1 
之 间 ， 包 括 0 和 nsems-1。 

IPC_STAT 对 此 集合 取 semid_ds 结 构 ， 并 存储 在 由 arg.buf 指 向 的 结 
构 中 。 

IPC_SET 按 arg.buf 指 问 的 结构 中 的 值 ， 设 置 与 此 集合 相关 的 结构 中 
的 sem_perm.uid、sem_perm.gid 和 sem_perm.mode 字 段 。 此 命令 只 能 由 两 
种 进程 执行 : 一 种 是 其 有 效用 户 ID 等 于 sem_perm.cuid 或 sam_perm.uid 的 





进程 ， 另 一 种 是 具有 超级 用 户 特 权 的 进程 。 
IPC_RMID 从 系统 中 删除 该 信号 量 集 合 。 这 种 删除 是 立即 发 生 的 。 
删除 时 仍 在 使 用 此 信 写 量 集合 的 其 他 进程 ， 在 它们 下 次 试图 对 此 信号 量 
集合 进行 操作 时 ， 将 出 错 返 回 EIDRM。 此 命令 只 能 由 两 种 进程 执行 : 
一 种 是 其 有 效用 户 ID 等 于 sem_perm.cuid 或 sem_perm.uid 的 进程 ， 男 一 种 
是 具有 超级 用 户 特权 的 进程 。 
GETVAL 返回 成 员 semnum 的 semval 值 。 
SETVAL 设置 成 员 semnum 的 semval 值 。 该 值 由 arg.val 指 定 。 
GETPID 返回 成 员 semnum 的 sempid 值 。 
GETNCNT 返回 成 员 semnum 的 semncnt 值 。 
GETZCNT 返回 成 员 semnum 的 semzcnt 值 。 
GETALL 取 访 集合 中 所 有 的 信号 量 值 。 这 些 值 存储 在 arg.array 指 癌 
的 数组 中 。 
oa 将 该 集合 中 所 有 的 信号 量 值 设 置 成 arg.array 指 回 的 数组 中 
人 


对 于 除 GETALL 以 外 的 所 有 GET 命 令 ， fae neces on 
对 于 其 他 命令 ， 帮 成功 则 返回 值 为 0， 知 出 错 ， 则 设置 errno 并 返 

函数 semop 上 自动 执行 信号 量 集合 上 的 操作 数组 

#include <sys/sem.h> 

int semop(int semid, struct sembuf semoparray[], size_t nops); 

BREA: ARH, Beo; £h, 返回 - 1 

参数 semoparray 是 一 个 指针 ， 它 指 问 一 个 由 sembuf 结 构 表示 的 信号 

量 操作 数组 : 


struct sembuf { 























unsigned short sem_num; /* member # in set (0, 1, ... 
nsems-1 */ 

short sem_op; /* operation(negative, 
0,or pasitive */) 

short sem_flg; [5 IPC_NOWAIT, 
SEM_UNDO */ 


}; 

参数 nops 规 定 该 数组 中 操作 的 数量 〈 元 素数 ) 。 

对 集合 中 每 个 成 员 的 操作 由 相应 的 sem_op 值 规 定 。 此 值 可 以 是 负 
值 、0 或 正 值 。〈 下 面 的 讨论 将 提 到 信号 量 的 “undo” 标 志 。 此 标志 对 应 
于 相应 的 sem _flg 成 员 的 SEM_UNDO 位 。) 

(1) 最 易于 处 理 的 情况 是 sem_op 为 正 值 。 这 对 应 于 进程 释放 的 占 
用 的 资源 数 。sem_op ” 值 会 加 到 信号 量 的 值 上 。 如 果 指 定 了 undo 标 志 ， 


则 也 从 该 进程 的 此 信号 量 调整 值 中 减 去 sem_op。 
(2) 知 sem_op 为 负 值 ， 则 表示 要 获取 由 该 信号 量 控制 的 资源 。 

如 车 该 信号 量 的 值 大 于 等 于 sem_op 的 绝对 值 (共有 所 需 的 资 
源 ) ， 则 从 信号 量 值 中 减 去 ”sem_op 的 绝对 值 。 这 能 保证 信号 量 的 结果 
值 大 于 等 于 0。 如 果 指 定 了 undo 标志 ， 则 sem_op 的 绝对 值 也 加 到 该 进 
程 的 此 信号 量 调整 值 上 。 

如 果 信 号 量 值 小 于 sem_op 的 绝对 值 〈 资 源 不 能 满足 要 求 ) ， 则 适用 
下 列 条 件 。 

a. 若 指定 了 IPC_NOWAIT， 则 semop 出 错 返 回 EAGAIN。 

b. 若 未 指定 IPC_NOWAIT， 则 该 信号 量 的 semncnt 值 加 1《〈 因 为 调 
So enna! ， 然 后 调用 进程 被 挂 起 直至 下 列 事件 之 一 发 


i. 此 信号 量 值 变 成 人 于 等 于 sem_ op 的 绝对 值 〈 即 某 个 进程 已 释放 
了 某 些 资源 ) 。 此 信号 量 的 semncnt 值 减 1 CAND REE) ， 并 且 从 
ao SEHR Asen op 的 的 绝对 值 。 

如 果 指 定 了 undo 标 志 ， 则 sem_op 的 绝对 值 也 加 到 该 进程 的 此 信和 号 量 
调整 值 上 。 

这 .从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 函 数 出 错 返 回 
EIDRM 

iii. 进程 捕捉 到 一 个 ag, FFM pierre ian 在 这 种 情况 
下 ， 此 信号 量 的 semncnt 值 减 1〈 因 为 调用 进程 不 再 等 ， 并 且 函 数 出 
错 返 回 EINTR 。 

(3) 知 sem_op 为 0， 这 表示 调用 进程 希望 等 竺 到 该 信号 量 值 变 成 


如 果 信 和 号 量 值 当前 是 0， 则 此 函数 立即 返回 。 

如 果 信 和 号 量 值 非 0， 则 适用 下 列 条 件 。 

a. 若 指 定 了 IPC_NOWAIT， 则 出 错 返 回 EAGAIN。 

b. 若 未 指定 IPC_NOWAIT， 则 该 信号 量 的 semzcnt 值 加 1 (因为 
i ， 然 后 调用 进程 被 挂 起 ， 直 至 下 列 的 一 个 事 
i 此 信号 量 值 变 成 0。 此 信号 量 的 semzcnt 值 减 1 (因为 调用 进程 已 
结束 等 待 〉。 

ii. 从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 函 数 出 错 返 回 
EIDRM 

iii. 进程 捕捉 到 一 个 信号 ， 并 从 信号 处 理 程序 返回 。 在 这 种 情况 
Ts 此 信号 量 的 semzcnt 值 减 1 《因为 调用 进程 不 再 等 待 ) ， 并 且 函 数 出 
错 返 回 EINTR 。 
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semop 函 数 具 有 原子 性 ， 它 或 者 执行 数组 中 的 所 有 操作 ， 或 者 一 个 
也 不 做 。 

exit 时 的 信号 量 调整 

正如 前 面 提 到 的 ， 如 果 在 进程 终止 时 ， 它 占用 了 经 由 信号 量 分 配 的 
资源 ， 那 么 就 会 成 为 一 个 问题 。 无 论 何 时 只 要 为 信号 量 操作 指定 了 
SEM_UNDO 标 志 ， 然 后 分 配 资 源 (sem_op 值 小 于 0) ， 那 么 内 核 就 会 记 
住 对 于 该 特定 信号 量 ， 分 配给 调用 进程 多 少 资源 〈sem_op 的 绝对 值 ) 。 
当 该 进程 终止 时 ， 不 论 自愿 或 者 不 自愿 ， 内 核 都 将 检验 该 进程 是 否 还 有 
尚未 处 理 的 信号 量 调整 值 ， 如 果 有 ， 则 按 调 整 值 对 相应 信号 量 值 进行 处 
理 。 

如 果 用 带 SETVAL 或 SETALEL 命 令 的 semctl 设 置 一 个 信号 量 的 值 ， 则 
在 所 有 进程 中 ， 该 信号 量 的 调整 值 都 将 设置 为 0。 

实例 : 信号 量 、 记 录 锁 和 互 斥 量 的 时 间 比 较 

如 果 在 多 个 进程 间 共 享 一 个 资源 ， 则 可 使 用 这 3 种 技术 中 的 一 种 来 
协调 访问 。 我 们 可 以 使 用 映射 到 两 个 进程 地 址 空间 中 的 信号 量 、 记 录 锁 
人 

知 使 用 信号 量 ， 则 先 创建 一 个 包含 一 个 成 员 的 信和 号 量 集 合 ， 然 后 将 
该 信号 量 值 初 始 化 为 1。 为 了 分 配 资源 ， 以 sem_op 为 -1 调用 semop。 
为 了 释放 资源 ， 以 sem_op 为 +1 调 用 semop。 对 每 个 操作 都 指定 
SEM_UNDO， 以 处 理 在 未 释放 资源 条 件 下 进程 终止 的 情况 。 

知 使 用 记录 锁 ， 则 先 创建 一 个 空 文件 ， 并 且 用 访 文 件 的 第 一 个 字 节 
(无 需 存 在 ) 作为 锁 字 节 。 为 了 分 配 资源 ， 先 对 该 字 节 获得 一 个 写 锁 。 
释放 该 资源 时 ， 则 对 该 字 节 解锁 。 记 录 锁 的 性 质 确 保 了 当 一 个 锁 的 持 有 
者 进程 终止 时 ， 内 核 会 自动 释放 该 锁 。 

若 使 用 互 斥 量 ， 需 要 所 有 的 进程 将 相同 的 文件 映射 到 它们 的 地 址 空 
间 里 ， 并 且 使 用 PTHREAD_ PROCESS SHARED 互 斥 量 属性 在 文件 的 相 
同 偏 移 处 初始 化 互 斥 量 。 为 了 分 配 资源 ， 我 们 对 互 斥 量 加 锁 。 为 了 释放 
锁 ， 我 们 解锁 互 斥 量 。 如 果 一 个 进程 没有 释放 互 斥 量 而 终止 ， 恢 复 将 是 
非常 困难 的 ， 除 非 我 们 使 用 鲁 棒 互 斥 量 〈 回 忆 12.4.1 节 中 讨论 的 
pthread_mutex_consistenteA| #0) 。 

图 15-29 显 示 了 在 Linux 上 ， 使 用 这 3 种 不 同 技术 进行 锁 操 作 所 需 的 
时 间 。 在 每 一 种 情况 下 ， 资 源 都 被 分 配 、 释 放 1 000 000 次 。 这 同时 由 3 
个 不 同 的 进程 执行 。 图 15-29 中 所 示 的 时 间 是 3 个 进程 的 总 计 ， 单 位 是 


秒 。 
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#7 undo 的 信号 量 0.50 7.55 


建议 性 记录 锁 0.51 4.38 
共享 存储 中 的 互 斥 量 0.21 0.25 
图 15-29 Linux 上 锁 替 代 技 术 的 时 间 比 较 








在 Linux 上 ， 记 录 锁 比 信号 量 快 ， 但 是 共享 存储 中 的 互 斥 量 的 性 能 
比 信 号 量 和 记录 锁 的 都 要 优越 。 如 采 我 们 能 单一 资源 加 锁 ， 并 且 不 需要 
XSI 信 号 量 的 所 有 花哨 功能 ， 那 么 记录 锁 将 比 信 号 量 要 好 。 原 因 是 它 使 
用 起 来 更 简单 、 速 度 更 快 〈 在 这 个 平台 上 ) ， 当 进程 终止 时 系统 会 管理 
遗留 下 来 的 锁 。 尽 管 对 于 这 种 平台 来 说 ， 在 共享 存储 中 使 用 互 斥 量 是 一 
个 更 快 的 选择 ， 但 是 我 们 依然 喜欢 使 用 记录 锁 ， 除 非 要 特别 考虑 性 能 。 
这 样 做 有 两 个 原因 。 首 先 ， 在 多 个 进程 间 共 享 的 内 存 中 使 用 互 斥 量 来 恢 
复 一 个 终止 的 进程 更 难 。 其 次 ， 进 程 共享 的 互 斥 量 属 性 还 没有 得 到 普 志 
支持 。 在 Single UNIX Specification 的 老 版 本 中 ， 这 是 可 选 的 。 尽 管 在 
SUSv4 中 依然 十 可 选 的 ， 但 是 现在 ， 所 有 让 循 XSI 的 实现 都 要 求 使 用 


Kio 
在 本 书 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 Solaris 10 当 前 支持 进程 
共享 的 互 斥 量 属性 。 
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需要 在 客户 进程 和 服务 器 进程 之 间 复 制 ， 所 以 这 是 最 快 的 一 种 IPC。 使 
用 共 至 存储 时 要 掌握 的 唯一 寄 门 是 ， 在 多 个 进程 之 间 同 步 访问 一 个 给 定 
的 存储 区 。 奉 服务 器 进程 正在 将 数据 放 入 共 至 存储 区 ， 则 在 它 做 完 这 一 
操作 之 前 ， 客 户 进程 不 应 当 去 取 这 些 数据 。 通 常 ， 信 号 量 用 于 同步 共享 
存储 访问 。 不 过 正如 前 节 最 后 部 分 所 述 ， 也 可 以 用 记录 锁 或 互 斥 
量 。) 











Single UNIX Specification 在 其 共享 存储 对 象 选 项 中 包括 了 访问 共享 

存储 的 蔡 代 接口 ， 这 些 接口 源 于 实时 扩展 。 本 书 不 讨论 这 些 接口 。 

我 们 已 经 看 到 了 共享 存储 的 一 种 形式 ， 就 是 在 多 个 进程 将 同一 个 文 
件 映射 到 它们 的 地 址 空间 的 时 候 。XSI 共享 存储 和 内 存 映 射 的 文件 的 不 
同 之 处 在 于 ， 前 者 没有 相关 的 文件 。XSI 共享 存储 段 是 内 存 的 匿名 段 。 

内 核 为 每 个 共享 存储 段 维 护 着 一 个 结构 ， 该 结构 至 少 要 为 每 个 共享 
存储 段 包含 以 下 成 员 : 

struct shmid_ds { 

struct ipc_perm shm_perm; /* see Section 15.6.2 */ 








size_t shm segsz; /* size of segment in bytes */ 
pid_t shm_lIpid; /* pid of last shmop() */ 

pid_t shm_cpid; /* pid of creator */ 

shmatt_t shm_nattch; /* number of current attaches */ 
time_t shm_atime; /* last-attach time */ 

time_t shm_dtime; /* last-detach time */ 

time_t shm_ctime; /* last-change time */ 


(按照 文 持 共享 存储 段 的 需要 ， 每 种 实现 会 增加 其 他 结构 成 员 。 ) 
shmatt_t 类 型 定义 为 无 符号 整 型 ， 它 至 少 与 unsigned ”short 一 样 大 。 
图 15-30 列 出 了 影响 共享 存储 的 系统 限制 。 
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图 15-30 影响 共享 存储 的 系统 限制 
调用 的 第 一 个 函数 通常 是 shmget， 它 获得 一 个 共享 存储 标识 符 。 
#include <sys/shm.h> 
int shmget(key_t key, size_t size, int flag); 
返回 值 : ARJ, RRS aD; 在 出 错 ， 返 回 -1 
15.6.1 市 说 明了 将 key 变 换 成 一 个 标识 符 的 规则 ， 以 及 是 创建 一 个 新 
共 至 存储 段 ， 还 是 引用 一 个 现 有 的 共享 存储 段 。 当 创建 一 个 新 段 时 ， 初 
始 化 shmid_ds 结 构 的 下 列 成 员 。 
“ipc_perm 结 构 按 15.6.2 节 中 所 述 进行 初始 化 。 该 结构 中 的 mode 按 
flag 中 的 相应 权限 位 设置 。 这 些 权 限 用 图 15-24 中 的 值 指定 。 
“shm_lpid、shm_nattach、shm_atime 和 shm_dtime 都 设置 为 0。 
“shm_ctime 设 置 为 当前 时 间 。 
“shm_segsz 设 置 为 请 求 的 size。 
参数 size 是 该 共 译 存储 段 的 长 度 ， 以 字 市 为 单位 。 实 现 通常 将 其 问 
上 取 为 系统 页 长 的 整 倍数 。 但 是 ， 若 应 用 指定 的 size 值 并 非 系 统 页 长 的 
整 倍数 ， 那 么 最 后 一 页 的 余下 部 分 是 不 可 使 用 的 。 如 果 正 在 创建 一 个 新 
Be (通常 在 服务 器 进程 中 ) ， 则 必须 指定 其 size。 如 采 正 在 引用 一 个 现 
存 的 段 〈 一 个 客户 进程 ) ， 则 将 size 指定 为 0。 当 创建 一 个 新 段 时 ， 段 内 
的 内 容 初始 化 为 0。 
shmctl 函 数 对 共享 存储 段 执 行 多 种 操作 。 
#include <sys/shm.h> 
int shmctl(int shmid, int cmd, struct shmid_ds *buf); 
返回 值 : AR, GO; 若 出 错 ， 返 回 -1 
cmd 参 数 指定 下 列 5 种 命令 中 的 一 种 ， 使 其 在 shmid 指 定 的 段 上 执 


IPC_STAT 取 此 段 的 shmid_ds 结 构 ， 并 将 它 存 储 在 由 buf 指 向 的 结构 





中 。 

IPC_SET 按 buf 指 向 的 结构 中 的 值 设 置 与 此 共享 存储 段 相 关 的 
shmid_ds 结构 中 的 下 列 3 个 字段 : shm_perm.uid. shm_perm.gid#ll 
shm_perm.mode。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效用 户 
ID 等 于 shm_perm.cuid 或 shm_perm.uid 的 进程 ， 另 一 种 是 具有 超级 用 户 特 
权 的 进程 。 

IPC_RMID 从 系统 中 删除 该 共享 存储 段 。 因 为 每 个 共享 存储 段 维护 
着 一 个 连接 计数 (shmid_ds 结 构 中 的 shm_nattch 字 上段， 所 以 除非 使 用 
该 段 的 最 后 一 个 进程 终止 或 与 该 段 分 离 ， 人 否则 不 会 实际 上 删除 该 存储 
段 。 不 管 此 段 是 否 仍 在 使 用 ， 该 段 标识 符 都 会 被 立即 删除 ， 所 以 不 能 
用 shmat 与 该 段 连接 。 此 命令 只 能 由 下 列 两 种 进程 执行 : 一 种 是 其 有 效 
用 户 ID 等 于 shm_perm.cuid 或 shm_perm.uid 的 进程 ， 另 一 种 是 具有 超级 
用 户 特权 的 进程 。 

Linuxz 和 Solaris 提 供 了 另外 两 种 命令 ， 但 它们 并 非 Single UNIX 
Specification 的 组 成 部 分 。 

SHM_LOCK 在 内 存 中 对 共享 存储 段 加 锁 。 此 命令 只 能 由 超级 用 户 


执行 。 

SHM_UNLOCK 解锁 共享 存储 段 。 此 命令 只 能 由 超级 用 户 执行 。 

一 旦 创建 了 一 个 共享 存储 段 ， 进 程 束 可 调用 shmat 将 其 连接 到 它 的 
地 址 空间 中 。 

#include <sys/shm.h> 

void *shmat(int shmid, const void *addr, int flag); 

返回 值 : 知 成 功 ， 返 回 指 同 共享 存储 段 的 指针 ; 知 出 错 ， 返 回 -1 

共享 存储 段 连 接 到 调用 进程 的 哪个 地 址 上 与 addr 参 数 以 及 flag 中 是 
否 指定 SHM_RND 位 有 关 。 

如 果 addr 为 0， 则 此 段 连接 到 由 内 核 选 择 的 第 一 个 可 用 地 址 上 。 这 
是 推荐 的 使 用 方式 。 

。 如 果 addr 非 0， 并 且 没 有 指定 SHM_RND， 则 此 段 连接 到 addr 所 指定 
的 地 址 上 。 

“如果 addr 非 0， 并 且 指 定 了 SHM_RND， 则 此 段 连接 到 (addr-(addr 
mod SHMLBA)) 所 表示 的 地 址 上 。SHM_RND 命 令 的 意思 是 “ 取 整 ”。 
SHMLBA 的 意思 是 “ 低 边 界 地 址 倍数 ”"， 它 总 是 2 的 乘 方 。 该 算式 是 将 地 
址 向 下 取 最 近 1 个 SHMLBA 的 倍数 。 

除非 只 计划 在 一 种 硬件 上 运行 应 用 程序 (这 在 当今 是 不 大 可 能 
的 ) ， 人 否则 不 应 指定 共享 存储 段 所 连接 到 的 地 址 。 而 是 应 当 指 定 addr 为 
0， 以 便 由 系统 选择 地 址 。 

如 果 在 flag 中 指定 了 SHM_RDONLY 位 ， 则 以 只 读 方式 连接 此 段 ， 











否则 以 读 写 方式 连接 此 段 。 

shmat 的 返回 值 是 该 段 所 连接 的 实际 地 址 ， 如 果 出 错 则 返回 -1。 如 
果 shmat 成 功 执行 ， 那 么 内 核 将 使 与 该 共享 存储 段 相 关 的 shmid_ds 结 构 
中 的 shm_nattch 计 数 器 值 加 1。 

当 对 共享 存储 段 的 操作 已 经 结束 时 ， 则 调用 shmdt 与 该 段 分 离 。 注 
意 ， 这 并 不 从 系统 中 删除 其 标识 符 以 及 其 相关 的 数据 结构 。 该 标识 符 仍 
然 存 在 ， 直 至 东 个 进程 〈 一 般 是 服务 器 进程 ) 带 IPC_RMID 命 令 的 调用 
shmctl 特 地 删除 它 为 目 。 

#include <sys/shm.h> 

int shmdt(const void *addr); 

返回 值 : ERJ, E0; AR, Wel-1 

addr 参 数 是 以 前 调用 shmat 时 的 返回 值 。 如 果 成 功 ，shmdt 将 使 相关 
shmid_ds 结 构 中 的 shm_nattch 计 数 器 值 减 1。 

实例 

内 核 将 以 地 址 0 连接 的 共享 存储 段 放 在 什么 位 置 上 与 系统 密切 相 
图 15-31 中 的 程序 打印 了 一 些 特定 系统 存放 各 种 类 型 的 数据 的 位 置 
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#include "apue.h" 
#include <sys/shm,h> 


#define ARRAY SIZE 40000 
#define MALLOC SIZE 100000 
#define SHM SIZE 100000 
#define SHM MODE 0600 /* user read/write */ 


char array[ARRAY SIZE];  /* uninitialized data = bss */ 


int 
Main (void) 
{ 
int shmid; 
char *ptr, *shmptr; 


printf("array[] from p to %p\n", (void *)&array[0], 
(void *) Sarray [ARRAY SIZE]); 
printf("stack around Sp\n", (void *) &shmid) ; 


if ((ptr = malloc (MALLOC_SIZE)) == NULL) 
err_sys ("malloc error"); 
printf("malloced from %p to %p\n", (void *)ptr, 
(void *)ptr+MALLOC_SIZE) ; 


if ((shmid = shmget (IPC PRIVATE, SHM SIZE, SHM MODE)) < 0) 
err_sys("shmget error"); 
if ((shmptr = shmat(shmid, 0, 0)) == (void *)-1) 
err_sys("shmat error"); 
printf ("shared memory attached from p to %p\n", (void *)shmptr, 
(void *)shmptr+SHM SIZE) ; 


if (shmctl (shmid, IPC_RMID, 0) < 0) 
err_sys("shmctl error"); 


exit (0); 




















图 15-31 打印 各 种 类 型 的 数据 存放 的 位 置 

在 一 个 基于 Intel 的 64 位 Linux 系 统 上 运行 此 程序 ， 其 输出 如 下 : 

$ ./a.out 

array[] from 0x6020c0 to 0x60bd00 

stack around 0x7fff957b146c 

malloced from 0x9e3010 to 0x9fb6b0 

shared memory attached from 0x7fba578ab000 to 0x7fba578c36a0 

图 15-32 显 示 了 这 种 情况 ， 这 与 图 7-6 中 所 示 的 典型 存储 区 布局 类 
似 。 注 意 ， 共 享 存储 段 紧 靠 在 栈 之 下 。 

回忆 一 下 mmap 函 数 〈 见 14.8 节 ) ， 它 可 将 一 个 文件 的 若干 部 分 映 
射 至 进程 地 址 空间 。 这 在 概念 上 类 似 于 用 shmat XSI IPC 函 数 连接 一 个 共 
享 存储 段 。 两 者 之 间 的 主要 区 别 是 ， 用 mmap 映 射 的 存储 段 是 与 文件 相 
关联 的 ， 而 XSI 共 享 存储 段 则 并 无 这 种 关联 。 
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0x7fff957b146c 


} 命令 行 参数 


0x7£ba578c36a0 


共享 存储 oyna 
0x7£ba578ab000 


ie 0x0000009fb6b0 
100,000 Ff} malloc 
0x0000009e3010 


z 0x00000060bd00 

未 初始 化 的 数据 40.000 字 书 的 array[ ] 

(bss) 0x0000006020c0 
已 初始 化 的 数据 
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图 15-32 在 基于 Intel 的 Linux 系 统 上 的 存储 区 布局 

实例 : /dev/zero 的 存储 映射 

共享 存储 可 由 两 个 不 相关 的 进程 使 用 。 但 是 ， 如 果 进 程 是 相关 的 ， 
则 某 些 实现 提供 了 一 种 不 同 的 技术 。 

下 面 说 明 的 技术 用 于 FreeBSD 8.0、Linux 3.2.0 和 Solaris 10. Mac OS 
X 10.6.8 当 前 并 不 文 持 将 字符 设备 映射 至 进程 地 址 空间 。 

在 读 设备 /dev/zero 时 ， 该 设备 是 0 字 节 的 无 限 资 源 。 它 也 接收 写 向 
它 的 任何 数据 ， 但 又 忽略 这 些 数据 。 我 们 对 此 设备 作为 IPC 的 兴趣 在 
于 ， 当 对 其 进行 存储 映射 时 ， 它 具有 一 些 特殊 性 质 。 

“创建 一 个 未 命名 的 存储 区 ， 其 长 度 是 mmap 的 第 二 个 参数 ， 将 其 问 
上 取 整 为 系统 的 最 近 页 长 。 

“存储 区 都 初始 化 为 0。 





“如 果 多 个 进程 的 共同 祖先 进程 对 mmap 指 定 了 MAP_SHARED 标 
志 ， 则 这 些 进 程 可 共享 此 存储 区 。 
图 15-33 中 的 程序 是 使 用 此 特殊 设备 的 一 个 例子 。 





#include "apue.h" 
#include <fcntl.h> 
#include <sys/mman.h> 


#define NLOOPS 1000 
#define SIZE sizeof(long) /* size of shared memory area */ 


static int 
update(long *ptr) 
{ 


return ((*ptr) ++); /* return value before increment */ 


int 
main (void) 


{ 


int fd, i, counter; 
pid t pid; 
void *area; 


if ((fd = open("/dev/zero", O_RDWR)) < 0) 
err_sys ("open error"); 
if ((area = mmap(0, SIZE, PROT_READ | PROT_WRITE, MAP_SHARED, 


fd, 0)) == MAP_FAILED) 
err_sys("mmap error"); 
close (fd); /* can close /dev/zero now that it's mapped */ 


TELL _WAIT(); 


if ((pid = fork()) < 0) { 
err_sys ("fork error"); 


} else if (pid > 0) { /* parent */ 
for (i = 0; i < NLOOPS; i += 2) { 
if ((counter = update((long *)area)) != i) 


err quit ("parent: expected Sd, got %d", i, counter); 


TELL_CHILD (pid) ; 
WAIT CHILD(); 
} 
} else { /* child */ 
for (i = 1; i < NLOOPS + 1; i += 2) { 
WAIT PARENT () ; 


if ((counter = update((long *)area)) != i) 
err _quit("child: expected %d, got %d", i, counter); 


TELL_PARENT (getppid()); 


exit (0); 








图 15-33 在 父 进程 、 子 进程 之 间 使 用 /dewzero 的 存储 映射 TO 的 IPC 

该 程序 打开 此 /devwzero 设 备 ， 然 后 指定 长 整 型 的 长 度 调 用 mmap。 
注意 ,一旦 存储 区 映射 成 功 ， 我 们 就 要 关闭 (dlose) 此 设备 。 然 后 ， 进 
程 创建 一 个 子 进程 。 因 为 在 调用 mmap 时 指定 了 MAP_SHARED， 所 以 
一 个 进程 写 到 存储 映射 区 的 数据 可 被 男 一 进程 见 到 。 如 果 已 指定 
MAP_PRIVATE， 则 此 程序 不 能 工作 。) 

然后 ， 父 进程 、 子 进程 交 蔡 运行 ， 它 们 使 用 8.9 节 中 的 同步 函数 各 
上 自 对 共享 存储 映射 区 中 的 长 整 型 数 加 1。 存 储 映射 区 由 mmap 初 始 化 为 
0。 父 进程 先 对 它 进 行 增 1 操 作 ， 使 其 成 为 1， 然 后 子 进 程 对 其 进行 增 1 操 
作 ， 使 其 成 为 2， 然 后 父 进程 使 其 成 为 ?9， 依 此 类 推 。 注 意 ， 当 在 update 
eee 因为 增加 的 是 其 值 ， 而 不 是 指针 ， 所 以 必须 

TT o 

以 上 述 方式 使 用 /dev/zero 的 优点 是 : 在 调用 mmap 创建 映射 区 之 
前 ， 无 需 存 在 一 个 实际 文件 。 映 射 /dev/zero 自动 创建 一 个 指定 长 度 的 映 
射 区 。 这 种 技术 的 缺点 是 : 它 只 在 两 个 相关 进程 之 间 起 作用 。 但 在 相关 
进程 之 间 使 用 线程 可 能 更 为 简单 有 效 ( 见 第 11 章 和 第 12 章 ) 。 注 意 ,， 无 
论 使 用 哪 一 种 技术 ， 都 需 对 共享 数据 进行 同步 访问 。 

实例 : 匿名 存储 映射 

很 多 实现 提供 了 一 种 类 似 于 /dewzero 的 设施 ， 称 为 匿名 存储 映射 。 
为 了 使 用 这 种 功能 ， 要 在 调用 mmap 时 指定 MAP_ANON 标 志 ， 并 将 文件 
摘 述 符 指 定 为 -1。 结 果 得 到 的 区 域 是 匿名 的 《因为 它 并 不 通过 一 个 文件 
ee ea ， 并 且 创 建 了 一 个 可 与 后 代 进 程 共享 的 存 
PAN 

本 书 讨论 的 4 种 平台 都 文 持 匿 名 存储 映射 设施 。 但 是 注意 ，Linux 
为 此 设备 定义 了 MAP_ANONYMOUS 标 志 ， 并 将 MAP_ANON 标 志 定 义 
为 与 它 相 同 的 值 以 改善 应 用 的 可 移植 性 。 

为 使 图 15-33 中 的 程序 应 用 这 个 设施 ， 我 们 对 它 做 了 3 处 修改 : 
Ca) 删除 了 /dev/zero 的 open 语 句 ， (b) 删除 了 fd 的 close 语 句 ，(c) 将 
mmap 调 用 修改 如 下 : 

if ((area = mmap(0, SIZE, PROT_READ | PROT_WRITE, 

MAP_ANON | MAP_SHARED, -1, 0)) == MAP_FAILED) 

此 调用 指定 了 MAP_ANON 标 志 ， 并 将 文件 描述 符 设 置 为 -1。 图 15- 
33 中 的 程序 的 其 余部 分 没 变 。 

最 后 两 个 实例 说 明了 在 多 个 无 关 进程 之 间 如 何 使 用 共享 存储 段 。 如 
果 在 两 个 无 关 进 程 之 间 要 使 用 共 说 存储 段 ， 那 么 有 两 种 蔡 代 的 方法 。 一 
种 是 应 用 程序 使 用 XSI 共 享 存储 函数 ， 男 一 种 是 使 用 mmap 将 同一 文件 映 
射 至 它们 的 地 址 空间 ， 为 此 使 用 MAP_SHARED 标 志 。 




















15.10 POSIX 信 号 量 


POSIX 信 号 量 机 制 是 3 种 IPC 机 制 之 一 ，3 种 IPC 机 制 源 于 POSIX.1 的 
实时 扩展 。Single UNIX Specification 将 3 种 机 制 (消息 队列 、 信 号 量 和 
共享 存储 ) 置 于 可 选 部 分 中 。 在 SUSv4 之 前 ，POSIX 信 和 号 量 接口 已 经 被 
包含 在 信号 量 选项 中 。 在 SUSv4 中 ， 这 些 接口 被 移 至 了 基本 规范 ， 而 消 
恩 队 列 和 共享 存储 接口 依然 是 可 选 的 。 

POSIX 信 号 量 接口 意 在 解决 XSI 信 号 量 接口 的 几 个 缺陷 。 

。 相 比 于 XSI 接 口 ，POSIX 信 号 量 接口 考虑 到 了 更 高 性 能 的 实现 。 

POSIX 信号 量 接口 使 用 更 简单 : 没有 信号 量 集 ， 在 熟悉 的 文件 系 
统 操 作 后 一 些 接口 被 模式 化 了 。 尽 管 没 有 要 求 一 定 要 在 文件 系统 中 实 
现 ， 但 是 一 些 系统 的 确 是 这 么 实现 的 。 

“POSIX 信 号 量 在 删除 时 表现 更 完美 。 回 忆 一 下 ， 当 一 个 XSI 信 号 量 
被 删除 时 ， 使 用 这 个 信号 量 标识 符 的 操作 会 失败 ， 并 将 errno 设 置 成 
EIDRM。 使 用 POSIX 信 号 量 时 ， 操 作 能 继续 正常 工作 直到 该 信号 量 的 最 
后 一 次 引用 被 释放 。 

POSIX 信 号 量 有 两 种 形式 : 命名 的 和 未 命名 的 。 它 们 的 差异 在 于 创 
建 和 销毁 的 形式 上 ， 但 其 他 工作 一 样 。 未 命名 信号 量 只 存在 于 内 存 中 ， 
并 要 求 能 使 用 信号 量 的 进程 必须 可 以 访问 内 存 。 这 意味 着 它们 只 能 应 用 
在 同一 进程 中 的 线程 ， 或 者 不 同 进程 中 已 经 映射 相同 内 存 内 容 到 它们 的 
地 址 空间 中 的 线程 。 相 反 ， 命 名 信号 量 可 以 通过 名 字 访 问 ， 因 此 可 以 被 
任何 已 知 它 们 名 字 的 进程 中 的 线程 使 用 。 

我 们 可 以 调用 sem_open 函 数 来 创建 一 个 新 的 命名 信号 量 或 者 使 用 一 
WALES 

#include <semaphore.h> 

sem_t *sem_open(const char *name, int oflag, ... /* mode_t mode, 

unsigned int value */ ); 
返回 值 : 大 成 功 ， 返 回 指 癌 信号 量 的 指针 ;和 寿 出 错 ， 返 回 SEM_FAILED 

当 使 用 一 个 现 有 的 命名 信号 量 时 ， 我 们 仅仅 指定 两 个 参数 : 信号 量 
的 名 字 和 oflag 参数 的 0 值 。 当 这 个 oflag 参 数 有 O_CREAT 标 志 集 时 ， 如 
果 命 名 信号 量 不 存在 ， 则 创建 一 个 新 的 。 如 果 它 已 经 存在 ， 则 会 被 使 
用 ,但 是 不 会 有 额外 的 初始 化 发 生 。 

当 我 们 指定 O_CREAT 标 志 时 ， 需 要 提供 两 个 额外 的 参数 。mode 参 
数 指定 谁 可 以 访问 信号 量 。mode 的 取 值 和 打开 文件 的 权限 位 相同 : 用 















































户 读 、 用 户 写 、 用 户 执行 、 组 读 、 组 写 、 组 执行 、 其 他 读 、 其 他 写 和 其 
他 执行 。 赋 值 给 信号 量 的 权限 可 以 被 调用 者 的 文件 创建 屏蔽 字 修 改 〈 见 
45 N48) 。 注 意 ， 只 有 读 和 写 访问 要 紧 ， 但 是 当 我 们 打开 一 个 现 
有 信号 量 时 接口 不 允许 指定 模式 。 实 现 经 常 为 读 和 写 打开 信和 号 量 。 
在 创建 信号 量 时 ，value 参 数 用 来 指定 信号 量 的 初始 值 。 它 的 取 值 是 
0~SEM_VALUE_MAX (Jil, 42-9) 。 
如 果 我 们 想 确保 创建 的 是 信号 量 ， 可 以 设置 oflag 参 数 为 
O_CREATIO_EXCL。 如 果 信 和 号 量 已 经 存在 ， 会 导致 sm_open 失 败 。 
为 了 增加 可 移植 性 ， 在 选择 信号 量 命名 时 必须 遵循 一 定 的 规则 。 
“名 字 的 第 一 个 字符 应 该 为 斜 枉 〈/) 。 尽 管 没 有 要 求 POSIX 信 和 号 量 
的 实现 要 使 用 文件 系统 ， 但 是 如 果 使 用 了 文件 系统 ， Bel at BEE A FAK 
解释 时 消除 二 义 性 。 
,名字 不 应 包含 其 他 斜 杠 以 此 避免 实现 定义 的 行为 。 例如 ， 如 果 文 
件 系统 被 使 用 了 ， 那 么 名 字 /mysem 和 和 //mysem 会 被 认定 为 是 同一 个 文件 
名 ， 但 是 如 果实 现 没 有 使 用 文件 系统 ， 那 么 这 两 种 命名 可 以 被 认为 是 不 
同 的 《考虑 下 如 果实 现 把 名 字 哈 希 运算 转换 成 一 个 用 来 识别 信和 号 量 的 整 
数值 会 发 生 什 么 ) 。 
“信号 量 名 字 的 最 大 长 度 是 实现 定义 的 。 名 字 不 应 该 长 于 
_POSIX_NAME_MAX (WLR) 2-8) 个 字符 长 度 。 因 为 这 是 使 用 文件 系 
统 的 实现 能 允许 的 最 大 名 季 长 度 的 限制 。 
如 果 想 在 信号 量 上 进行 操作 ，sem_open 函 数 会 为 我 们 返回 一 个 信号 
量 指针 ， 用 于 传递 到 其 他 信号 量 函 数 上 。 当 完成 信号 量 操作 时 ， 可 以 调 
用 sem_close 函 数 来 释放 任何 信号 量 相关 的 资源 。 
#include <semaphore.h> 
int sem_close(sem_t *sem); 
返回 值 : ARJ, Belo; 肴 出 错 ， 返 回 -1 
如 果 进 程 没有 首先 调用 sem_close 而 退出 ， 那 么 内 核 将 自动 关闭 任何 
打开 的 信号 量 。 注 意 ， 这 不 会 影响 信号 量 值 的 状态 一 如 果 已 经 对 它 进行 
了 增 1 操 作 ， 这 并 不 会 仅 因 为 退出 而 改变 。 类 似 地 ， 如 果 调 用 
sem_close， 信 号 量 值 也 不 会 受到 影响 。 在 XSI 信 号 量 中 没有 类 似 
SEM_UNDO 标 志 的 机 制 。 
可 以 使 用 sem_unlink 函 数 来 销毁 一 个 命名 信和 号 量 
#include <semaphore.h> 
int sem_unlink(const char *name); 
返回 值 : MI, eO; 各 出错， 返回 -1 
sem_unlink 函 数 删 除 信号 量 的 名 字 。 如 果 没 有 打开 的 信号 量 引用 ， 
则 该 信号 量 会 被 销毁 。 和 否则， 销毁 将 延迟 到 最 后 一 个 打开 的 引用 关闭 。 


















































不 像 XSI 信 号 量 ， 我 们 只 能 通过 一 个 函数 调用 来 调节 POSIX 信 和 号 量 
的 值 。 计 数 减 1 和 对 一 个 二 进 制 信号 量 加 锁 或 者 获取 计数 信号 量 的 相关 
资源 是 相 类 似 的 。 

注意 ， 信 号 量 和 POSIX 信 号 量 之 间 是 没有 差别 的 。 是 采用 二 进 制 信 
写 量 还 是 用 计数 信号 量 取 决 于 如 何 初始 化 和 使 用 信号 量 。 如 果 一 个 信号 
量 只 是 有 值 0 或 者 1， 那 么 它 就 是 二 进 制 信号 量 。 当 二 进 制 信号 量 是 1 
时 ， 它 就 是 “解锁 的 "， 如 果 它 的 值 是 9， 那 就 是 “加 锁 的 ”。 

可 以 使 用 sem_wait 或 者 sem_trywait 函 数 来 实现 信号 量 的 减 1 操作 。 

#include <semaphore.h> 

int sem_trywait(sem_t *sem); 

int sem_wait(sem_t *sem); 

两 个 函数 的 返回 值 ， 奢 成功， 返回 0; 知 出 错 则 ， 返 回 -1 

使 用 sem_wait 孙 数 时 ， 如 果 信 号 量 计 数 是 0 就 会 发 生 阻 塞 。 直 到 成 
功 使 信号 量 减 1 或 者 被 信号 中 断 时 才 返 回 。 可 以 使 用 sem_trywait 函 数 来 
避免 阻塞 。 调 用 sem_trywait 时 ， 如 果 信 号 量 是 0(， 则 不 会 阻 终 ， 而 是 会 
返回 -1 并 且 将 errmo 置 为 ECAGAIN。 

第 三 个 选择 是 阻塞 一 段 确定 的 时 间 。 为 此 ， 可 以 使 用 sem_timewait 
函数 。 

#include <semaphore.h> 

#include <time.h> 

int sem_timedwait(sem_t *restrict sem, 

const struct timespec *restrict tsptr); 
返回 值 : ERJ, GeO; 大 出 错 ， 返 回 -1 

想 要 放弃 等 待 信号 量 的 时 候 ， 可 以 用 tsptr 参 数 指定 绝对 时 间 。 超 时 
是 基于 CLOCK_REALTIME 时 钟 的 《回忆 图 6-8) 。 如 果 信 号 量 可 以 立 
即 减 1， 那 么 超时 值 就 不 重要 了 ， 尺 管 指定 的 可 能 是 过 去 的 某 个 时 间 ， 
言 号 量 的 减 1 操作 依然 会 成 功 。 如 果 超 时 到 期 并 且 信 号 量 计数 没 能 减 
1, sem_timedwait 将 返回 -1 且 将 ermo 设 置 为 ETIMEDOUT。 

可 以 调用 sem_post 函 数 使 信号 量 值 增 1。 这 和 解锁 一 个 二 进 制 信号 
量 或 者 释放 一 个 计数 信号 量 相关 的 资源 的 过 程 是 类 似 的 。 

#include <semaphore.h> 

int sem_post(sem_t *sem); 

返回 值 : ERJ, WO; 大 出 错 ， 返 回 -1 

调用 sem_post 时 ， 如 果 在 调用 sem_wait 〈 或 者 sem_timedwait) 中 发 
生 进 程 阻 塞 ， 那 么 进程 会 被 唤醒 并 且 被 sm_post 增 1 的 信号 量 计数 会 再 
次 被 sm_wait (或 者 sem_timedwait) 减 1。 

当 我 们 想 在 单个 进程 中 使 用 POSIX 信 号 量 时 ， 使 用 未 命名 信号 量 更 


























容易 。 这 仅仅 改变 创建 和 销毁 信号 量 的 方式 。 可 以 调用 sem_init 函 数 来 
创建 一 个 未 命名 的 信号 量 。 
#include <semaphore.h> 
int sem_init(sem_t *sem, int pshared, unsigned int value); 
返回 值 : ERJ, WO; 大 出 错 ， 返 回 -1 
pshared 参 数 表 明 是 人 否 在 多 个 进程 中 使 用 信号 量 。 如 条 是 ， 将 其 设置 
成 一 个 非 0 值 。value 参 数 指定 了 信和 号 量 的 初始 值 。 
需要 声明 一 个 sem_t 类 型 的 变量 并 把 它 的 地 址 传递 给 sem_init 来 实现 
初始 化 ， 而 不 是 像 sem_open 函 数 那 样 返回 一 个 指向 信号 量 的 指针 。 如 果 
要 在 两 个 进程 之 间 使 用 信号 量 ， 需 要 确保 sem 参 数 指向 两 个 进程 之 间 共 
享 的 内 存 范 围 。 
对 未 命名 信号 量 的 使 用 已 经 完成 时 ， 可 以 调用 sem_destroy 函 数 丢 春 
Es 
#include <semaphore.h> 
int sem_destroy(sem_t *sem); 
返回 值 : ERJ, WO; Aus, eE- 
调用 sem_destroy 后 ， 不 能 再 使 用 任何 带 有 sem 的 信号 量 图 数 ， 除 非 
通过 调用 sem_init 重 新 初始 化 它 。 
sem_getvalue 冰 数 可 以 用 来 检索 信号 量 值 。 
#include <semaphore.h> 
int sem_getvalue(sem_t “restrict sem, int *restrict valp); 
返回 值 : ERJ, EO; 大 出 错 ， 返 回 -1 
成 功 后 ，valp 指 向 的 整数 值 将 包含 信号 量 值 。 但 是 请 注意 ， 我 们 试 
图 要 使 用 我 们 刚 读 出 来 的 值 的 时 候 ， 信 号 量 的 值 可 能 已 经 变 了 。 除 非 使 
用 额外 的 同步 机 制 来 避免 这 种 竞争 ， 否 则 sem_getvalue 函 数 只 能 用 于 调 
io 
Mac OS X 10.6.8 x #'sem_getvalue rk 2 
实例 
介绍 POSIX 接 口 的 动机 之 一 就 是 ， 通 过 设计 ， 它 们 的 性 能 要 明显 好 
于 现 有 XSI 信 号 量 接口 。 下 面 将 了 解 现 有 系统 是 否 达到 了 这 个 目标 ， 尽 
管 这 些 系统 没有 设计 文 持 实时 的 应 用 。 
在 图 15-34 中 ， 让 3 个 进程 在 两 种 平台 (Linux 3.2.0 和 Solaris 10) 上 
苑 争 分 配 和 释放 信号 量 1 000 000 次 ， 比 较 了 分 别 使 用 XSI 信 号 量 〈 不 素 
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SEM UNDO) 和 POSIX 信 号 量 时 的 性 能 。 





























Solaris 10 Linux 3.2.0 


ISF | 285 | 279] | E | 393 | F335 
13.72 | 10.52 | 2444 | 0.26 | 0.75 | 041 


图 15-34 信号 量 实现 的 时 间 比 较 

在 图 15-34 中 可 以 看 到 ， 在 Solaris 系 统 中 ，POSIX 信 号 量 相对 于 XSI 
言 号 量 在 时 间 上 仅 提 高 了 129%， 但 是 在 Linux 系 统 中 却 提 高 了 94% 〈 近 18 
倍 的 速度 ) 。 如 果 跟 踪 程 序 ， 我 们 会 发 现 ，POSIX 信 号 量 的 Linux 实 现 
人 
HT Ho 

实例 

回忆 图 12-5，Single UNIX Specification 并 没 用 定义 当 一 个 线程 对 一 
个 普通 互 斥 量 加 锁 ， 而 另 一 个 线程 试图 去 解锁 它 的 情况 ， 但 是 这 种 情况 
下 错误 检查 互 斥 量 和 递归 互 斥 量 会 产生 错误 。 因 为 二 进 制 信号 量 可 以 像 
互 斥 量 一 样 来 使 用 ， 我 们 可 以 使 用 信和 号 量 来 创建 自己 的 锁 原 语 从 而 提供 


HJF 
假设 我 们 将 要 创建 自己 的 锁 ， 这 种 锁 能 被 一 个 线程 加 锁 而 被 另 一 线 
程 解锁 ， 那 么 它 的 结构 可 能 是 这 样 的 : 
struct slock { 
sem_t *semp; 
char name[_ POSIX NAME MAX]; 
































上 
图 15-35 中 的 程序 展示 了 基于 信号 量 的 互 斥 原 语 的 实现 。 


#include "slock.h" 
#include <stdlib.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <errno.h> 





struct slock * 
s alloc() 


void 


struct slock *sp; 
static int cnt; 


if ((sp = malloc (sizeof (struct slock))) == NULL) 
return (NULL) ; 
do { 
snprintf(sp->name, sizeof (sp->name), "/%ld.%d", (long)getpid(), 
Cnt++) ; 


sp->semp = sem open(sp->name, O_CREAT|O_EXCL, S_IRWXU, 1); 
} while ((sp->semp == SEM FAILED) && (errno == EEXIST)); 
if (sp->semp == SEM FAILED) { 
free (sp); 
return (NULL) ; 
sem_unlink(sp->name) ; 
return (sp); 


s free(struct slock *sp) 


sem close (sp->semp) ; 
free (sp); 


int 
Ss lock(struct slock *sp) 
| 


return (sem walt (sp->semp) ) ; 


int 
s trylock(struct slock *sp) 
| 


return (sem trywait (sp->semp) ) ; 


int 
S unlock(struct slock *sp) 


| 


return (sem post (sp->semp) ) ; 


图 15-35 使 用 POSIX 信 号 量 的 互 斥 

根据 进程 ID 和 计数 喜来 创建 名 字 。 我 们 不 会 刻意 用 互 斥 量 去 保护 
计数 器 ， 因 为 当 两 个 竞争 的 线程 同时 调用 s_alloc 并 以 同一 个 名 字 结 束 
时 ， 在 调用 sem_open 中 使 用 O_EXCL 标 志 将 会 使 其 中 一 个 线程 成 功 而 另 
一 个 线程 失败 ， 失 败 的 线程 会 将 errno 设 置 成 EEXIST， 所 以 对 于 这 种 情 
况 ， 我 们 只 是 再 次 尝试 。 注 意 ， 我 们 打开 一 个 信号 量 后 断 开 了 它 的 连 
接 。 这 销毁 了 名 字 ， 所 以 导致 其 他 进程 不 能 再 次 访问 它 ， 这 也 简化 了 进 
程 结 束 时 的 清理 工作 。 








15.11 客户 进程 -服务 器 进程 属性 


下 面 详细 说 明 客 户 进程 和 服务 器 进程 的 某 些 属性 ， 这 些 属性 受到 它 
们 之 间 所 使 用 的 各 种 IPC 类 型 的 影响 。 最 简单 的 关系 类 型 是 使 客户 进程 
fork 然后 exec 所 希望 的 服务 器 进程 。 在 fork 之 前 先 创 建 两 个 半 双 工 管道 
使 数据 可 在 两 个 方向 传输 。 图 15-16 是 这 种 安排 的 一 个 例子 。 所 执行 的 
服务 器 进程 可 能 是 一 个 设置 用 户 ID 的 程序 ， 这 使 它 具 有 了 特权 。 另 
外 ， 服 务 器 进程 得 看 客户 进程 的 实际 用 户 ID 就 可 以 决定 客户 进程 的 真实 
身份 。《〈 回 忆 8.10 节 ， 从 中 可 了 解 到 在 exec 前 后 实际 用 户 ID 和 实际 组 ID 
并 没有 改变 。 ) 

在 这 种 安排 下 ， 可 以 构建 一 个 open 服 务 器 进程 Copen server) 。 
(17.5 节 提供 了 这 种 客户 进程 -服务 器 进程 机 制 的 一 种 实现 。) 它 为 客户 
进程 打开 文件 而 不 是 客户 进程 自己 调用 open esa. OREM EY DAE IE 
的 UNIX 用 户 权 限 、 组 权限 以 及 其 他 权限 之 上 或 之 外 ， 增 加 附加 的 权限 
检查 。 假 定 服 务 器 进程 执行 的 是 设置 用 户 ID 程序 ， 这 给 予 了 它 附加 的 权 
限 〈 很 可 能 是 root 权 限 ) 。 服 务 器 进程 用 客户 进程 的 实际 用 户 ID 来 决定 
是 否 给 予 它 对 所 请 求 文件 的 访问 权限 。 使 用 这 种 方式 ， 可 以 构建 一 个 服 
务 右 进程 ， 它 允许 某 些 用 户 获 得 通常 没有 的 访问 权限 。 

在 此 例子 中 ， 因 为 服务 器 进程 是 父 进程 的 子 进程 ， 所 以 它 所 能 做 的 
就 是 将 文件 内 容 传送 给 父 进 程 。 尽 管 这 种 方式 对 普通 文件 工作 得 很 好 ， 
但 是 对 有 些 文件 却 不 能 工作 ， 如 特殊 设备 文件 。 我 们 希望 能 做 的 是 使 服 
务 髓 进程 打开 所 要 求 的 文件 ， 并 传 回 文件 描述 符 。 但 是 实际 情况 却 是 父 
进程 可 辣子 进程 传送 打开 文件 描述 符 ， 而 子 进程 却 不 能 回 父 进程 传 回 文 
件 描述 符 《〈 除 非 使 用 专门 的 编程 技术 ， 这 将 在 第 17 章 介绍 ) 。 

图 15-23 中 展示 了 另 一 种 类 型 的 服务 器 进程 。 这 种 服务 器 进程 是 一 
个 守护 进程 ， 所 有 客户 进程 用 某 种 形式 的 IPC 与 其 联系 。 对 于 这 种 形式 
的 客户 进程 -服务 器 进程 关系 ， 不 能 使 用 管道 。 需 要 使 用 一 种 形式 的 命 
名 IPC， 如 FIFO 或 消息 队列 。 使 用 FIFO 时 ， 如 果 服 务 器 进程 必需 将 数据 
送 回 客户 进程 ， 则 对 每 个 客户 进程 都 要 有 单独 使 用 的 ” FIFO。 如果 客户 
进程 -服务 器 进程 应 用 程序 只 有 客户 进程 回 服 务 器 进程 发 送 数据 ， 则 只 
需要 一 个 众所周知 的 FIFO。 (System V 行 式 打印 机 假 脱 机 程序 使 用 这 种 
形式 的 客户 进程 -服务 器 进程 。 客 户 进程 是 lp(D) 命 令 ， 服 务 器 进程 是 
lpsched 守 护 进 程 。 因 为 只 有 从 客户 进程 到 服务 器 进程 的 数据 流 ， 所 有 只 
需 使 用 一 个 FIFO。 没 有 需要 送 回 客 户 进 程 的 数据 。) 


























使 用 消息 队列 则 存在 多 种 可 能 性 。 

(1) 在 服务 器 进程 和 所 有 客户 进程 之 间 只 使 用 一 个 队列 ， 使 用 每 
个 消息 的 类 型 字段 指明 谁 是 消息 的 接受 者 。 例 如 ， 客 户 进程 可 以 用 设置 
为 1 的 类 型 字段 来 发 送 它们 的 消息 。 在 请 求 之 中 应 包括 客户 进程 的 进程 
ID。 此 后 ， 服 务 器 进程 在 发 送 响应 消息 时 ， 将 类 型 字段 设置 为 客户 进程 
的 进程 ID。 服 务 器 进程 只 接受 类 型 字段 为 1 的 消息 (msgrcv 的 第 4 个 参 
数 ) ， 客 户 进程 则 只 接受 类 型 字段 等 于 它们 进程 ID 的 消息 。 

(2) 另 一 种 方法 是 每 个 客户 进程 使 用 一 个 单独 的 消息 队列 。 在 问 
服务 器 进程 发 送 第 一 个 请 求 之 前 ， 每 个 客户 进程 先 使 用 键 
IPC_PRIVATE 创 建 它 自己 的 消息 队列 。 服 务 器 进程 也 有 它 自己 的 队 
列 ， 其 键 或 标识 符 是 所 有 客户 进程 都 知道 的 。 客 户 进程 将 其 第 一 个 请 求 
发 送 到 服务 器 进程 的 众所周知 的 队列 上 ， 该 请 求 中 应 包含 其 客户 进程 消 
恩 队 列 的 队列 太 。 服 务 器 进程 将 其 第 一 个 啊 应 发 送 到 此 客户 进程 队列 ， 
此 后 的 所 有 请 求 和 响应 都 在 此 队列 上 交换 。 

使 用 消息 队列 的 这 两 种 技术 都 可 以 用 共享 内 存 段 和 同步 方法 (信和 号 
量 或 记录 锁 ) 来 实现 。 

使 用 这 种 类 型 的 客户 进程 -服务 器 进程 关系 (客户 进程 和 服务 器 进 
程 是 无 关 进程 》 的 问题 是 服务 器 进程 如 何 准确 地 标识 客户 进程 。 除 非 服 
务 器 进程 正在 执行 一 种 非特 权 操 作 ， 人 否则 服务 器 进程 知道 客户 进程 的 身 
份 是 很 重要 的 。 例 如 ， 若 服务 器 进程 是 一 个 设置 用 户 ID 程序 ， 就 有 这 
种 要 求 。 虽 然 所 有 这 几 种 形式 的 IPC 都 经 由 内 核 ， 但 是 它们 并 未 提供 任 
何 设施 使 内 核能 够 标识 发 送 者 。 

对 于 消息 队列 ， 如 果 在 客户 进程 和 服务 器 进程 之 间 使 用 一 个 专用 队 
列 〈 于 是 一 次 只 有 一 个 消息 在 该 队列 上 ) ， 那 么 队列 的 msg_lspid 包含 
了 对 方 进程 的 进程 ID。 但 是 当 客 户 进程 将 请 求 发 送 给 服务 器 进程 时 ， 
我 们 想 要 的 是 客户 进程 的 有 效用 户 ID， 而 不 是 它 的 进程 ID 。 现 在 还 没 
有 一 种 可 移植 的 方法 ， 在 已 知 进程 ID 情况 下 可 以 得 到 有 效用 户 ID。 (A 
然 地 ， 内 核 在 进程 表 项 中 保持 有 这 两 种 值 ， 但 是 除非 彻底 检查 内 核 存 储 
lH], BUCH, 无 法 得 到 男 一 个 s ) 

我 们 将 在 17.2 节 中 使 用 下 列 技术 ， 使 服务 器 进程 可 以 标识 客户 进 
程 。 这 一 技术 可 使 用 FIFO、 消 息 队 列 、 信 和 号 量 以 及 共享 存储 。 在 下 面 的 
说 明 中 假定 按 图 15-23 使 用 了 FIFO。 客 户 进程 必须 创建 它 自己 的 FIFO， 
并 且 设 置 该 FIFO 的 文件 访问 权限 ， 使 得 只 允许 用 户 读 和 用 户 写 。 假 定 服 
务 器 进程 具有 超级 用 户 特权 或 者 它 很 可 能 并 不 关心 客户 进程 的 真实 标 
识 ) ， 那 么 服务 器 进程 仍 可 读 、 写 此 FIFO。 当 服务 器 进程 在 众所周知 的 
FIFO 上 接收 到 客户 进程 的 第 一 个 请 求 时 〔( 它 应 当 包 含 客户 进程 专用 
FIFO 的 标识 ) ， 服 务 器 进程 调用 针对 客户 进程 专用 FIFO 的 stat 或 fstat。 





























服务 器 进程 假设 客户 进程 的 有 效用 户 ID 是 FIFO 的 所 有 者 〈stat 结 构 的 
st uid 字段 ) 。 服 务 器 进程 验证 该 FIFO 只 有 用 户 读 和 用 户 写 权限 。 服 务 
器 进程 还 应 检查 与 该 FIFO 有 关 的 3 个 时 间 量 (stat 结构 的 st_atime、 
st_mtime#llst_ctime FS) ， 要 检查 它们 与 当前 时 间 是 否 很 接近 《如 不 早 
于 当前 时 间 15 秒 或 30 秒 ) 。 如 果 一 个 恶意 客户 进程 可 以 创建 一 个 FIFO， 
使 男 一 个 用 户 成 为 其 所 有 者 ， 并 且 设 置 该 文件 的 权限 位 为 用 户 读 和 用 户 
写 ， 那 么 在 系统 中 就 存在 了 其 他 基础 性 的 安全 问题 。 

为 了 用 XSI IPC 实 现 这 种 技术 ， 回 想 一 下 与 每 个 消息 队列 、 信 号 量 
以 及 共享 存储 段 相关 的 ipc_perm 结 构 ， 它 标识 了 IPC 结 构 的 创建 者 (cuid 
和 cgid 字 段 ) 。 和 使 用 FIFO 的 实例 一 样 ， 服 务 咒 进程 应 当 要 求 客户 进程 
创建 该 IPC 结 构 ， 并 使 客户 进程 将 访问 权 设 置 为 只 允许 用 户 读 和 用 户 
写 。 服 务 器 进程 也 应 检验 与 该 IPC 相 关 的 时 间 值 与 当前 时 间 是 否 很 接近 
(因为 这 些 IPC 结 构 在 显 式 地 删除 之 前 一 直 存 在 〉。 

在 17.3 节 中 ， 将 会 看 到 进行 这 种 身份 验证 的 一 种 更 好 的 方法 ， 束 是 
内 核 提 供 客户 进程 的 有 效用 户 ID 和 有 效 组 ID 。 套 接 字 子 系统 在 两 个 进程 
之 间 传 送 文 件 描 述 符 时 可 以 做 到 这 一 点 。 











15.12 小 结 


本 章 详 细 说 明了 进程 间 通 信 的 多 种 形式 : 管道、 命名 管道 
(FIFO) 、 通 常 称 为 XSI IPC 的 3 种 形式 的 IPC (消息 队列 、 信 号 量 和 
共享 存储 ) ， 以 及 POSIX 提 供 的 蔡 代 信号 量 机 制 。 信 号 量 实 际 上 是 同步 
原 语 而 不 是 IPC， 常 用 于 共享 资源 〈 如 共享 存储 段 ) 的 同步 访问 。 对 于 
管道 ， 我 们 说 明了 popen 函 数 的 实现 、 协 同 进 程 以 及 使 用 标准 IJO 库 缓冲 
机 制 时 可 能 遇 到 的 问题 。 

经 过 分 别 对 消息 队列 与 全 双 工 管道 的 时 间 以 及 信号 量 与 记录 锁 的 时 
间 进 行 比 较 ， 提 出 了 下 列 建议 : 要 学 会 使 用 管道 和 FIFO， 因 为 这 两 种 基 
本 技术 仍 可 有 效 地 应 用 于 大 量 的 应 用 程序 。 在 新 的 应 用 程序 中 ， 要 尽 可 
能 避免 使 用 消息 队列 以 及 信号 量 ， 而 应 当 考 虑 全 双 工 管道 和 记录 锁 ， 它 
们 使 用 起 来 会 简单 得 多 。 共 享 存储 仍然 有 它 的 用 途 ， 虽 然 通 过 mmap 丁 
数 〈 见 14.8 节 ) 也 能 提供 同样 的 功能 。 
z 下 一 章 将 介绍 网 络 IPC， 它 们 使 进程 能 够 跨越 计算 机 的 边界 进行 通 

















15.1 在 图 15-6 的 程序 中 ， 在 父 进程 代码 的 末尾 删除 waitpid 前 的 
close， 结 果 将 如 何 ? 

15.2 在 图 15-6 的 程序 中 ， 在 父 进程 代码 的 末尾 删除 waitpid， 结 果 将 
如 何 ? 

15.3 WE popen 函数 的 参数 是 一 个 不 存在 的 命令 ， 会 造成 什么 结 
果 ? 编写 一 段 小 程序 对 此 进行 测试 。 

15.4 在 图 15-18 的 程序 中 ， 删 除 信号 处 理 程序 ， 执 行 该 程序 ， 然 后 
终止 子 进程 。 输 入 一 行 输入 后 ， 怎 样 才能 说 明 父 进程 是 由 SIGPIPE 终 上 
的 ? 

15.5 在 图 15-18 的 程序 中 ， 用 标准 IJO 库 代 蔡 进行 管道 读 、 写 的 read 
和 write。 

15.6 POSIX.1 加 入 waitpid 函 数 的 理由 之 一 是 ，POSIX.1 之 前 的 大 多 
数 系统 不 能 处 理 下 面 的 代码 。 

if ( (fp = popen("/bin/true", "r")) == NULL ) 


if ( (rc = system("sleep 100")) == -1) 
if (pclose(fp) == -1) 


若 在 这 段 代 码 中 不 使 用 waitpid 函 数 会 如 何 ? 用 wait 代 替 呢 ? 

15.7 当 一 个 管道 被 写 者 关闭 后 ， 解 释 select 和 poll 是 如 何 处 理 该 管 
道 的 输入 描述 符 的 。 为 了 确定 答案 是 否 正 确 ， 编 两 个 小 测试 程序 ， 一 个 
用 select， 男 一 个 用 poll。 
eee 
述 符 。 

15.8 ”如 果 popen 以 type 为 "r" 执 行 cmdstring， 并 将 结果 写 到 标准 错误 
输出 ， 结 果 会 如 何 ? 

15.9 既然 popen 函 数 能 使 shell 执 行 它 的 cmdstring 参 数 ， 那 么 
cmdstring 终 止 时 会 产生 什么 结果 ? 《提示 : 画 出 与 此 相关 的 所 有 进 
程 。) 

15.10 ”POSIX.1 特 别 声明 没有 定义 为 读 写 而 打开 FIFO。 虽 然 大 多 数 
UNIX 系 统 人 允许 读 写 FIFO， 但 是 请 用 非 阻 塞 方法 实现 为 读 写 而 打开 





FIFO. 

15.11 除非 文件 包含 敏感 数据 或 机 密 数 据 ， 人 否则 允许 其 他 用 户 读 文 
件 不 会 造成 损害 。 但 是 ， 如 果 一 个 恶意 进程 读 取 了 被 一 个 服务 器 进程 和 
几 个 客户 进程 使 用 的 消息 队列 中 的 一 条 消息 后 ， 会 产生 什么 后 果 ?” 恶意 
进程 需要 知道 哪些 信息 就 可 以 读 消息 BABI? 

15.12 编写 一 段 程序 完成 下 面 的 工作 。 执 行 一 个 循环 5 次 ， 在 每 次 循 
环 中 ， 创 建 一 个 消息 队列 ， 打 印 该 队列 的 标识 符 ， 然 后 删除 队列 。 接 着 
再 循环 5 次 ， 在 每 次 循环 中 利用 键 IPC_PRIVATE 创 建 消 息 队 列 ， 并 将 一 
程序 终止 后 用 ipcs(1) 查 看 消息 队列 。 解 释 队 列 标识 
符 

15.13 ”描述 如 何在 共享 存储 段 中 建立 一 个 数据 对 象 的 链接 列表 。 列 
表 指 针 如 何 存储 ? 

15.14 男 出 图 15-33 中 的 程序 运行 时 下 列 值 随 时 间 变 化 的 曲线 图 : 
进程 和 子 进程 中 的 变量 ii、 共享 存储 区 中 的 长 整 型 值 以 及 update 函 aR 
回 值 。 假设 子 进 程 在 fork 后 先 运行 。 

15.15 使 用 15.9 节 中 的 XSI 共 享 存储 函数 代 蔡 共享 存储 映射 区 ， 改 写 
图 15-33 中 的 程序 。 

15.16 使 用 15.8 节 中 的 XSI 信 号 量 函 数 改写 图 15-33 中 的 程序 ， 实 现 父 
进程 与 子 进 程 间 的 交 蔡 。 

15.17 使 用 建议 性 记录 锁 改写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进 
RELA] HAS Fo 

15.18 使 用 15.10 节 中 的 POSIX 信 号 量 函 数 改 写 图 15-33 中 的 程序 ， 实 
现 父 进 程 与 子 进程 间 的 交替 。 
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上 一 章 我 们 考察 了 各 种 UNIX 系 统 所 提供 的 经 典 进程 间 通 信 机 制 
(IPC) : 管道 、FIFO、 消 息 队 列 、 信 号 量 以 及 共享 存储 。 这 些 机 制 允 
许 在 同一 台 计 算 机 上 运行 的 进程 可 以 相互 通信 。 本 章 将 考察 不 同 计算 机 
(通过 网 络 相 连 ) 上 的 进程 相互 通信 的 机 制 : 网 络 进 程 间 通信 
(network IPC) 。 

在 本 章 中 ， 我 们 将 描述 套 接 字 网 络 进程 间 通 信 接 口 ， 进 程 用 该 接口 
能 够 和 其 他 进程 通信 ， 无 论 它 们 是 在 同一 台 计 算 机 上 还 是 在 不 同 的 计算 
机 上 。 实 际 上 ， 这 正 是 套 接 字 接口 的 设计 目标 之 一 : 同样 的 接口 既 可 以 
用 于 计算 机 间 通 信 ， 也 可 以 用 于 计算 机 内 通信 。 尽 管 套 接 字 接口 可 以 采 
用 许多 不 同 的 网 络 协 议 进 行 通信 ， 但 本 章 的 讨论 限制 在 因特网 事实 上 的 
通信 标准 : TCP/IP 协 议 栈 。 

POSIX.1 中 指定 的 套 接 字 API 是 基于 4.4 BSD 套 接 字 接口 的 。 尽 管 这 
些 年 套 接 字 接口 有 些 细微 的 变化 ， 但 是 当前 的 套 接 字 接口 与 20 世 纪 80 年 
代 早 期 4.2BSD 所 引入 的 接口 很 类 似 。 

本 章 仪 是 一 个 套 接 字 API 的 概述 。Stevens、Fenner 和 Rudoff[2004] 在 
有 关 UNIX 系 统 网 络 编程 的 权威 性 文献 中 详细 讨论 了 套 接 字 接口 。 

















16.2 ER rH 


套 接 字 是 通信 端点 的 抽象 。 正 如 使 用 文件 描述 符 访 问 文件 ， 应 用 程 
序 用 套 接 字 描 述 符 访 问 套 接 字 。 和 套 接 字 描 述 符 在 UNIX 系 统 中 被 当 作 是 
一 种 文件 描述 符 。 事 实 上 ， 许 多 处 理 文 件 描述 符 的 函数 《如 read 和 
write) 可 以 用 于 处 理 套 接 字 描述 符 。 

为 创建 一 个 套 接 字 ， 调 用 socket 函 数 。 

#include <sys/socket.h> 

int socket (int domain, int type, int protocol); 

BE: ERJ, BREAL GERT) 描述 符 ; A, e- 
参数 domain〈 域 ) 确定 通信 的 特性 ， 包 括 地 址 格式 《在 下 一 区 详细 
描述 )。 图 16-1 总 结 了 由 POSIX.1 指 定 的 各 个 域 。 各 个 域 都 有 目 己 表示 地 
址 的 格式 ， 而 表示 各 个 域 的 负数 都 以 AF_ 开 头 ， 意 指 地 址 族 Caddress 
family) 。 

我 们 将 在 17.2 市 讨论 UNIX 域 。 大 多 数 系统 还 定义 了 AF_LOCAL 
域 ， 这 是 AF_UNIX 的 别名 。AF_UNSPEC ” 域 可 以 代表 “任何 ” 域 。 历 史 
EF， 有 些 平台 文 持 其 他 网 络 协 议 ， 如 ”AF_IPX 域 代表 的 NetWare 协 议 
族 ， 但 这 些 协 议 的 域 常 数 没有 被 POSIX.1 标 准 定义 。 

















AF_INET IPv4 因特网 域 


AF INET6 IPv6 因特网 域 
AF UNIX UNIX 域 
AF UPSPEC 未 指定 





图 16-1 套 接 字 通信 域 
参数 type 确 定 套 接 字 的 类 型 ， 进 步 确定 通信 特征 。 图 16-2 总 结 了 
由 POSIX.1 定 义 的 套 接 字 类 型 ， 但 在 实现 中 可 以 目 由 增加 其 他 类 型 的 文 


持 。 








SOCK_DGRAM HERRI TERI AMT SEAT CHE 


SOCK RAW IP 协议 的 数据 报 接口 (在 POSIX.1 中 为 可 选 ) 
SOCK SEQPACKET HEKEI AFR TÆR MERRE 
SOCK_STREAM 有 序 的 、 可 靠 的 、 双 同 的 、 面 癌 连 接 的 字 节 流 


图 16-2 套 接 字 类 型 
参数 protocol 通 常 是 ” 0， 表示 为 给 定 的 域 和 套 接 字 类 型 选择 默认 协 
议 。 当 对 同一 域 和 套 接 字 类 型 支持 多 个 协议 时 ， 可 以 使 用 protocol 选择 
一 个 特定 协议 。 在 AF_INET 通信 域 中 ， 套 接 字 类 型 SOCK_STREAM 的 
默认 协议 是 传输 控制 协议 (Transmission Control Protocol，TCP) 。 在 
AF_INET 通 信 域 中 ， 套 接 字 类 型 SOCK_DGRAM 的 默认 协议 是 UDP。 图 
16-3 列 出 了 为 因特网 域 套 接 字 定义 的 协议 。 

















IPPROTO IP IPv4 网 际 协议 
IPPROTO IPV6 IPv6 网 际 协议 〈 在 POSX.1 中 为 可 选 ) 


IPPROTO_ICMP 因特网 控制 报 文 协议 Cnternet Control Message Protocol) 
IPPROTO_RAW 原始 中 数据 包 协 议 (在 POSX.1 中 为 可 选 ) 
IPPROTO_TCP 传输 控制 协议 

IPPROTO_UDP 用 户 数据 报 协议 (User Datagram Protocol ) 








图 16-3 为 因特网 域 套 接 字 定 义 的 协议 

对 于 数据 报 〈SOCK_DGRAM) 接口 ， 两 个 对 等 进程 之 间 通 信 时 不 
需要 逻辑 连接 。 只 需要 癌 对 等 进程 所 使 用 的 套 接 字 送出 一 个 报 文 。 

因此 数据 报 提供 了 一 个 无 连接 的 服务 。 另 一 方面 ， 字 节 流 
(SOCK_STREAM) 要 求 在 交换 数据 之 前 ， 在 本 地 套 接 字 和 通信 的 对 
等 进程 的 套 接 字 之 间 建 立 一 个 逻辑 连接 。 

数据 报 是 自 包 含 报 文 。 发 送 数 据 报 近似 于 给 某 人 邮寄 信件 。 你 能 邮 
寄 很 多 信 ， 但 你 不 能 保证 传递 的 次 序 ， 并 且 可 能 有 些 信件 会 丢失 在 路 








上 。 每 封 信 件 包 含 接收 者 地 址 ， 使 这 封 信 件 独立 于 所 有 其 他 信件 。 每 封 
信件 可 能 送 达 不 同 的 接收 者 。 

相反 ， 使 用 面向 连接 的 协议 通信 就 像 与 对 方 打 电 话 。 首 先 ， 需 要 通 
过 电话 建立 一 个 连接 ， 连 接 建立 好 之 后 ， 彼 此 能 双向 地 通信 。 每 个 连接 
是 端 到 端的 通信 和 链 路 。 对 话 中 不 包含 地 址 信息 ， 就 像 呼 叫 两 端 存在 一 个 
点 对 点 虚拟 连接 ， 并 且 连 接 本 身上 暗示 特定 的 源 和 目的 地 。 

SOCK_STREAM 套 接 字 提 供 字 节 流 服务 ， 所 以 应 用 程序 分 辨 不 出 
报 文 的 界限 。 这 意味 着 从 SOCK_STREAM 套 接 字 读数 据 时 ， 它 也 许 不 
会 返回 所 有 由 发 送 进 程 所 写 的 字 节 数 。 最 终 可 以 获得 发 送 过 来 的 所 有 数 
据 ， 但 也 许 要 通过 若干 次 函数 调用 才能 得 到 。 

SOCK_SEQPACKET 套 接 字 和 SOCK_STREAM 套 接 字 很 类 似 ， 只 
是 从 该 套 接 字 得 到 的 是 基于 报 文 的 服务 而 不 是 字 节 流 服 务 。 这 意味 着 从 
SOCK_SEQPACKET 套 接 字 接收 的 数据 量 与 对 方 所 发 送 的 一 致 。 流 控制 
传输 协议 (Stream Control Transmission Protocol, SCTP) 提供 了 因特网 
域 上 的 顺序 数据 包 服 务 。 

SOCK_RAW 套 接 字 提 供 一 个 数据 报 接口 ， 用 于 直接 访问 下 面 的 网 
络 层 〈 即 因特网 域 中 的 IPE) 。 使 用 这 个 接口 时 ， 应 用 程序 负责 构造 自 
己 的 协议 头 部 ， 这 是 因为 传输 协议 (如 TCP 和 UDP) 被 绕 过 了 。 当 创建 
-个 原始 套 接 字 时 ， 需 要 有 超级 用 户 特权 ， 这 样 可 以 防止 恶意 应 用 程序 
绕 过 内 建安 全 机 制 来 创建 报 文 。 

调用 socket 与 调用 open 相 类 似 。 在 两 种 情况 下 ， 均 可 获得 用 于 IO 的 
文件 描述 符 。 当 不 再 需要 该 文件 描述 符 时 ， 调 用 close 来 关闭 对 文件 或 套 
接 字 的 访问 ， 并 且 释 放 该 描述 符 以 便 重新 使 用 。 

虽然 套 接 字 描述 符 本 质 上 是 一 个 文件 描述 符 ， 但 不 是 所 有 参数 为 文 
件 描述 符 的 函数 都 可 以 接受 套 接 字 描 述 符 。 图 16-4 总 结 了 到 目前 为 止 所 
讨论 的 大 多 数 以 文件 描述 符 为 参数 的 函数 使 用 套 接 字 描述 符 时 的 行为 。 
未 指定 和 由 实现 定义 的 行为 通常 意味 着 该 函数 对 套 接 字 描 述 符 无 效 。 例 
te lseek 不 能 以 套 接 字 描述 符 为 参数 ， 因 为 套 接 字 不 支持 文件 偏 移 量 
THER 0 





























close ( a 
Dup 和 dup2 ( 见 3,12 忆 ) 
fchdir (14.23 4) 
chomod (J 49 1) 
fohown (14.11 区) 
ent] (3.14 WH) 








Fdatasync 和 fsync (A 3.13 1) 


fstat (14.21) 
ftruncate (14.131) 
ioctl (43.15 7) 

lseek (W361) 

mmap (Jl 14.8 1) 
poll (A 14.42 7) 

Pread Ml pwrite (3.114) 


read (13.7 i) Ml readv (H 14.6 1) 


select (Il 14.4.1 #1) 


write (1384) 和 writev (11461) 





释放 套 接 宁 

和 一 般 文件 描述 符 一 样 复制 

失败 ， 并 且 将 errno 设置 为 ENOTDIR 

未 指定 

由 实现 定义 

支持 一 些 命令 , 包括 FDUPFD、F_DUPFD CLOEXEC、F GETFD、 


F GETFL, F GETOWN, F SETFD, F SETFL AIF SETOWN 


由 实现 定义 

LAE stat 结构 成 员 ， 但 如 何 文 持 由 实现 定义 
MBE 

ERS, HRT ER Me 

由 实现 定义 (通常 失败 时 会 将 errno 设 为 ESPIPE) 
MAE 

正常 工作 

失败 时 会 将 errno WH ESPIPE 

与 没有 任何 标志 位 的 zecv ( 见 16. 节 ) 等 价 
正常 工作 

与 没有 任何 标志 位 的 send ( 见 16.5 节 ) 等 价 


图 16-4 文件 描述 符 函 数 使 用 套 接 字 时 的 行为 
套 接 字 通信 是 双向 的 。 可 以 采用 shutdown 函 数 来 禁止 一 个 套 接 字 的 


T/O. 
#include <sys/socket.h> 
int shutdown (int sockfd, int how); 
返回 值 : ARJ, Reo; AH, 8e- 
如 果 how 是 SHUT_RD《〈 关 闭 读 端 ) ， 那 么 无 法 从 套 接 字 读 取 数 


据 。 如 果 how 是 SHUT_WR (XA Sum) ， 那 么 无 法 使 用 套 接 字 发 送 数 
据 。 如 果 how 是 SHUT_RDWR， 则 既 无 法 读 取 数据 ， 又 无 法 发 送 数据 。 

能 够 关闭 (close) 一 个 套 接 字 ， 为 何 还 使 用 shutdown 呢 ? im BAG 
二 理由。 首先 ， 只 有 最 后 一 个 活动 引用 关闭 时 ，close 才 释放 网 络 端点 。 
这 意味 着 如 果 复 制 一 个 套 接 字 《如 采用 dup) ， 要 直到 关闭 了 最 后 一 个 
引用 它 的 文件 描述 符 才 会 释放 这 个 套 接 字 。 而 shutdown 人 允许 使 一 个 套 
接 字 处 于 不 活动 状态 ， 和 引用 它 的 文件 描述 符 数目 无 关 。 其 次 ， 有 时 可 
以 很 方便 地 关闭 套 接 字 双 向 传输 中 的 一 个 方向 。 例 如 ， 如 果 想 让 所 通信 
的 进程 能 够 确定 数据 传输 何 时 结束 ， 可 以 关闭 该 套 接 字 的 写 端 ， 然 而 通 
过 该 套 接 字 读 端 仍 可 以 继续 接收 数据 。 











16.3 Ur 


上 一 节 学 习 了 如 何 创建 和 销毁 一 个 套 接 字 。 在 学 习 用 套 接 字 做 一 些 
有 意义 的 事情 之 前 ， 需 要 知道 如 何 标识 一 个 目标 通信 进程 。 进 程 标识 由 
两 部 分 组 成 。 一 部 分 是 计算 机 的 网 络 地 址 ， 它 可 以 帮助 标识 网 络 上 我 们 
想 与 之 通信 的 计算 机 ， 另 一 部 分 是 该 计算 机 上 用 端口 号 表示 的 服务 ， 它 
可 以 帮助 标识 特定 的 进程 。 


16.3.1 字 节 序 
与 同一 台 计 算 机 上 的 进程 进行 通信 时 ， 一 般 不 用 考虑 字 节 序 。 字 市 


序 是 一 个 处 理 右 架构 特性 ， 用 于 指示 像 整 数 这 样 的 大 数据 类 型 内 部 的 字 
节 如 何 排序 。 图 16-5 显 示 了 一 个 32 位 整数 中 的 字 节 是 如 何 排序 的 。 











MSB LSB 
图 16-5 一 个 32 位 整数 的 字 节 序 
如 果 处 理 器 架构 支持 大 端 (big-endian) 字 节 序 ， 那 么 最 大 字 节 地 








址 出 现在 最 低 有 效 字 节 (Least Significant Byte, LSB) 上 。 小 端 (ittle- 
endian) FSMD: 最 低 有 效 字 节 包 含 最 小 字 市 地址。 注意 ， 不 管 
字 节 如 何 排序 ， 最 高 有 效 字 节 (Most Significant Byte, MSB) 总 是 在 左 
边 ， 最 低 有 效 字 节 总 是 在 右边 。 因 此 ， 如 果 想 给 一 个 32 ”位 整数 赋值 
































0x04030201， 不 管 字 节 序 如 何 ， 最 高 有 效 字 节 都 将 包含 4， 最 低 有 效 字 
节 都 将 包含 1。 如 果 接 下 来 想 将 一 个 字符 指针 Cop) 强制 转换 到 这 个 整 
数 地 址 ， 就 会 看 到 字 节 序 带 来 的 不 同 。 在 小 端 字 节 序 的 处 理 器 上 ，cp[0] 
指向 最 低 有 效 字 节 因 而 包含 1，cp[3] 指 向 最 高 有 效 字 节 因 而 包含 4。 相 
比较 而 言 ， 在 大 端 字 节 序 的 处 理 器 上 ，cp[0] 指 向 最 高 有 效 字 节 因而 包含 
4，cp[3] 指 向 最 低 有 效 字 节 因 而 包含 1。 图 16-6 总 结 了 本 文 所 讨论 的 4 种 
平台 的 字 节 序 。 


操作 系统 处 理 器 架构 


FreeBSD 8.0 Intel Pentium 









































Linux 3.2.0 Intel Core 15 
Mac OS X 10.6.8 Intel Core 2 Duo 
Solaris 10 Sun SPARC 





图 16-6 测试 平台 的 字 节 序 
有 些 处 理 器 可 以 配置 成 大 病 ， 也 可 以 配置 成 小 端 ， 因 而 使 问题 变 得 
更 让 人 困惑 。 
网 络 协议 指定 了 字 节 序 ， 因 此 异 构 计 算 机 系统 能 够 交换 协议 信息 而 
不 会 被 字 节 序 所 混淆 。TCP/IP 协 议 栈 使 用 大 病 字 节 序 。 应 用 程序 交换 格 
式 化 数据 时 ， 字 节 序 问题 就 会 出 现 。 对 于 TCP/ITP， 地 址 用 网 络 字 节 序 来 
表示 ， 所 以 应 用 程序 有 时 需要 在 处 理 器 的 字 节 序 与 网 络 字 节 序 之 间 转 换 
它们 。 例 如 ， 以 一 种 易 读 的 形式 打印 一 个 地 址 时 ， 这 种 转换 很 常见 。 
对 于 TCP/IP 应 用 程序 ， 有 4 个 用 来 在 处 理 器 字 节 序 和 网 络 字 市 厅 之 
间 实 施 转换 的 函数 。 
#include <arpa/inet.h> 
uint32_t htonl(uint32_t hostint32); 
返回 值 ， 以 网 络 字 市 序 表示 的 32 位 整数 
uint16_t htons(uint16_t hostint16); 
返回 值 : DA 2 E45 Fr Ae aS E 
uint32_t ntohl(uint32_t netint32); 
返回 值 ， 以 主机 字 市 序 表示 的 32 位 整数 
uint16_t ntohs(uint16_t netint16); 
返回 值 : 以 主机 字 节 序 表示 的 16 位 整数 
h 表 示 “ 主 机 ” 字 节 序 ，n 表 示 “ 网 络 ” 字 节 序 。] 表 示 “ 长 ”( 即 4 字 节 ) 
整数 ，s 表 示 “ 短 ”( 即 4 字 节 ) 整数 。 虽 然 在 使 用 这 些 函 数 时 包含 的 是 




















<arpa/inet.h> 汰 文件 ， 但 系统 实现 经 常 是 在 其 他 头 文件 中 声明 这 些 函数 
的 ， 只 是 这 些 头 文件 都 包含 在 <arpa/inet.h> 中 。 对 于 系统 来 说 ， 把 这 些 
函数 实现 为 宏 也 是 很 常见 的 。 


16.3.2 地 址 格式 


一 个 地 址 标识 一 个 特定 通信 域 的 套 接 字 端 点 ， 地 址 格式 与 这 个 特定 
的 通信 域 相关 。 为 使 不 同 格式 地 址 能 够 传 入 到 套 接 字 函数 ， 地 址 会 被 强 
制 转 换 成 一 个 通用 的 地 址 结构 sockaddr: 
struct sockaddr { 
sa_family_t sa_family; /* address family */ 
char sa_data[]; /* variable-length address */ 





t 
套 接 字 实现 可 以 自由 地 添加 额外 的 成 员 并 且 定 义 sa_data 成 员 的 大 
小 。 人 例如， 在 Linux 中 ， 该 结构 定义 如 下 : 
struct sockaddr { 
sa_family_t sa_family; /* address family */ 
char sa_data[14]; /* variable-length address */ 
F 
但 是 在 FreeBSD 中 ， 该 结构 定义 如 下 : 
struct sockaddr { 


unsigned char sa_len; /* total length */ 
sa_family_t sa_family; /* address family */ 
char sa_data[14]; /* variable-length address */ 


}; 
特 网 地 址 定义 在 <netinetin.h> 头 文件 中 。 在 IPv4 因 特 网 域 
(AF_INET) 中 ， 套 接 字 地 址 用 结构 sockaddr in 表示 : 


struct in_addr { 


in_addr t s_ addr; /* [Pv4 address */ 
F 
struct sockaddr_in { 
sa_family_t sin_family; /* address family */ 
in_port_t sin_port; /* port number */ 
struct in_addr sin addr.; /* IPv4 address */ 


上 
数据 类 型 in_port_t 定 义 成 uint16_t。 数 据 类 型 in_addr t 定 义 成 


uint32 t。 这 些 整数 类 型 在 <stdint.h> 中 定义 并 指定 了 相应 的 位 数 。 

与 AF_INET 域 相 比 较 ，IPv6 因 特 网 域 (AF_INET6) 套 接 字 地 址 用 
结构 sockaddr_in6 表 示 : 

struct_in6_addr { 


uint8_t s6_addr| 16]; /* [Pv6 address */ 
ie 
struct sockaddr_in6 { 

sa_family_t sin6_family; /* address family 
*/ 

in_port_t sin6_port; /* port number */ 

uint32 ft sin6_flowinfo; /* traffic class and 
flow info */ 

struct in6_addr sin6_addr; /* IPv6 address*/ 

uint32 t sin6_scope_id; /* set of interfaces 


for scope */ 


t 
这 些 都 是 Single UNIX Specification 要 求 的 定义 。 每 个 实现 可 以 自由 
添加 更 多 的 字段 。 例 如 ， 在 Linux 中 ，sockaddr in 定义 如 下 : 


struct sockaddr_in { 


sa_family_t sin_family; /* address family */ 
in_port_t sin_port; /* port number */ 
struct in6_addr sin6_addr; /* IPv4 address */ 
unsigned char sin_zero[8]; /* filler */ 


}; 

其 中 成 员 sin_zero 为 填充 字段 ， 应 该 全 部 被 置 为 0。 

注意 ， 尽 管 sockaddr in 与 sockaddr in6 结构 相差 比较 大 ， 但 它们 
均 被 强制 转换 成 sockaddr 结 构 输 入 到 套 接 字 例 程 中 。 在 17.2 节 ， 将 会 看 
到 UNIX 域 套 接 字 地 址 的 结构 与 上 述 两 个 因特网 域 套 接 字 地 址 格式 的 不 


同 。 

有 时 ， 需 要 打印 出 能 被 人 理解 而 不 是 计算 机 所 理解 的 地 址 格式 。 
BSD 网 络 软件 包含 函数 inet _addr 和 inet_ntoa， 用 于 二 进 制 地 址 格式 与 点 
分 十 进 制 字符 表示 〈a.b.c.d) 之 间 的 相互 转换 。 但 是 这 些 函数 仅 适 用 于 
IPv4 地 址 。 有 两 个 新 函数 inet_ntop 和 inet_pton 具 有 相似 的 功能 ， 而 且 同 
时 支持 IPv4 地 址 和 IPv6 地 址 。 

#include <arpa/inet.h> 

const char *inet_ntop(int domain, const void *restrict addr, 

char *restrict str, socklen_t size); 


返回 值 : 知 成 功 ， 返 回 地 址 字符 串 指 针 ; 知 出 错 ， 返 回 NULL 
int inet_pton(int domain, const char * restrict str, 
void *restrict addr); 
返回 值 : AB, wlll; FRATA Beo; Fh, Re- 
函数 inetntop ”将 网 络 字 节 序 的 二 进 制 地 址 转换 成 文本 字符 串 格 
式 。inet_pton 将 文本 字符 串 格 式 转换 成 网 络 字 市 序 的 二 进 制 地 址 。 参 数 
domain 仅 支持 两 个 值 : AF_INET 和 AF_INET6。 
对 于 inet_ntop， 参 数 size 指 定 了 保存 文本 字符 串 的 绥 冲 区 (str) 的 
大 小 。 两 个 常数 用 于 简化 工作 : INET_ADDRSTRLEN 定义 了 足够 大 的 
空间 来 存放 一 个 表示 IPv4 地 址 的 文本 字符 串 ; INET6_ADDRSTRLEN 
定义 了 足够 大 的 空间 来 存放 一 个 表示 IPv6 ”地 址 的 文本 字符 串 。 对 于 
inet_pton， 如 果 domain 是 AF_INET， 则 缓冲 区 addr 需 要 足够 大 的 空间 来 
存放 一 个 32 位 地 址 ， 如 果 domain 是 AF_INET6， 则 需要 足够 大 的 空间 来 
存放 一 个 128 位 地 址 。 





16.3.3 Hihi Æ M 


理想 情况 下 ， 应 用 程序 不 需要 了 解 一 个 套 接 字 地 址 的 内 部 结构 。 如 
果 一 个 程序 简单 地 传递 一 个 类 似 于 sockaddr 结 构 的 套 接 字 地 址 ， 并 且 不 
o 特性 ， 那 么 可 以 与 提供 相同 类 型 服务 的 许多 不 同 
历史 上 ，BSD 网 络 软件 提供 了 访问 各 种 网 络 配置 信息 的 接口 。6.7 
市 简要 讨论 了 网 络 数据 文件 和 用 来 访问 这 些 文件 的 函数 。 本 市 将 更 详细 
地 讨论 一 些 细节 ， 并 且 引 入 新 的 函数 来 查询 寻 址 信息 。 
这 些 函 数 返 回 的 网 络 配置 信息 被 存放 在 许多 地 方 。 这 个 信息 可 以 存 
放 在 静态 文件 (如 /etc/hosts ”和 /etc/services) 中 ， 也 可 以 由 名 字 服 务 管 
理 ， 如 域名 系统 (Domain Name System, DNS) 或 者 网 络 信息 服务 
(Network Information Service, NIS) 。 无 论 这 个 信息 放 在 何 处 ， 都 可 
以 用 同样 的 函数 访问 它 。 
通过 调用 gethostent， 可 以 找到 给 定 计算 机 系统 的 主机 信息 。 
#include <netdb.h> 
struct hostent *gethostent(void); 
返回 值 : A), BEJE: 寿 出 错 ， 返 回 NULL 
void sethostent(int stayopen); 
void endhostent(void); 
如 果 主 机 数据 库 文件 没有 打开 ，gethostent 会 打开 它 。 函 数 
gethostent 返 回 文件 中 的 下 一 个 条 目 。 函 数 sethostent 会 打开 文件 ， 如 果 文 














件 已 经 被 打开 ， 那 么 将 其 回 绕 。 当 stayopen 参 数 设置 成 非 0 值 时 ， 调 用 
gethostent 之 后 ， 文 件 将 依然 是 打开 的 。 函 数 endhostent 可 以 关闭 文件 。 

当 gethostent 返 回 时 ， 会 得 到 一 个 指 癌 hostent 结 构 的 指针 ， 该 结构 可 
能 包含 一 个 静态 的 数据 绥 冲 区 ， 每 次 调用 gethostent， 绥 冲 区 都 会 被 宪 
mio hostet KELER FKA: struct hostent{ 


char *h name; /* name of host */ 

char **h_aliases; /* pointer to alternate host name array */ 
int h_addrtype; /* address type */ 

int h_length; /* length in bytes of address */ 


char **h_addr_list; /* pointer to array of network addresses */ 


} 

返回 的 地 址 采用 网 络 字 节 序 。 

男 外 两 个 函数 gethostbyname 和 gethostbyaddr， 原 来 包含 在 hostent 函 
数 中 ， 现 在 则 被 认为 是 过 时 的 。SUSv4 已 经 删除 了 它们 。 马 上 将 会 看 到 
它们 的 蔡 代 函数 。 

能 够 采用 一 套 相 似 的 接口 来 获得 网 络 名 字 和 网 络 编写。 

#include <netdb.h> 

struct netent *getnetbyaddr (uint32_t net, int type); 

struct netent *getnetbyname(const char *name); 

struct netent *getnetent(void); 

3 个 函数 的 返回 值 : ARI, REE a, JK IEINULL 

void setnetent(int stayopen); 

void endnetent(void); 

netent 结 构 至 少 包 含 以 下 字段 : 


struct netent { 


char *n name; /* network name */ 

char **n aliases; /* alternate network name array pointer 
*/ 

int n_addrtype; /* address type */ 

uint32 t n_net; /* network number */ 
}; 


网 络 编号 按照 网 络 字 节 序 返回 。 地 址 类 型 是 地 址 族 常量 之 一 〈 如 
AF_INET) 。 

我 们 可 以 用 以 下 函数 在 协议 名 字 和 协议 编号 之 间 进 行 映 射 。 

#include <netdb.h> 


struct protoent *getprotobyname(const char *name); 
struct protoent *getprotobynumber(int proto); 
struct protoent *getprotoent(void); 
3 个 函数 的 返回 值 : AA, GRIST; Aas, JK IEINULL 
void setprotoent(int stayopen); 
void endprotoent(void); 
POSIX.1 定 义 的 protoent 结 构 至 少 包含 以 下 成 员 : 


struct protoent { 


char *p_name; /* protocol name */ 

char **p_ aliases; /* pointer to altername protocol name 
array */ 

int p_proto; /* protocol number */ 


上 

服务 是 由 地 址 的 端口 写 部 分 表示 的 。 每 个 服务 由 一 个 唯一 的 众 所 周 
知 的 端口 号 来 文 持 。 可 以 使 用 函数 getservbyname 将 一 个 服务 名 映射 到 一 
个 端口 号 ， 使 用 函数 getservbyport 将 一 个 端口 号 映射 到 一 个 服务 名 ， 使 
用 函数 getservent 顺 序 扫描 服 务 数 据 库 。 

#include <netdb.h> 

struct servent *getservbyname(const char *name, const char *proto); 

struct servent *getserbyport(int port, const char *proto); 

struct servent *getservent(void); 

3 个 函数 的 返回 值 : AA, GRIESE, Acie, JK IEINULL 

void setservent(int stayopen); 

void endservent(void); 

servent 结 构 至 少 包含 以 下 成 员 ; 


struct servent{ 





char *s_name; /* service name */ 
char **s_aliases; /* pointer to alternate service name array 
w 
int s_port; /* port number */ 
char *s_proto; /* name of protocol */ 
l 
I 


POSIX.1 定 义 了 奋 干 新 的 函数 ， 人 允许 一 个 应 用 程序 将 一 个 主机 名 和 
一 个 服务 名 映射 到 一 个 地 址 ， 或 者 反之 。 这 些 函 数 代 符 了 较 老 的 函数 
gethostbyname 和 gethostbyaddr。 


子 ， 


getaddrinfo 函 数 允 许 将 一 个 主机 名 和 一 个 服务 名 映射 到 一 个 地 址 。 
#include <sys/socket.h> 
#include <netdb.h> 
int getaddrinfo(const char *restrict host, 

const char *restrict service, 

const struct addrinfo *restrict hint, 

struct addrinfo **restrict res); 

返回 值 ， 奉 成功， 返回 0;， 帮 出错， 返回 非 0 错误 码 

void freeaddrinfo(struct addrinfo *ai); 
需要 提供 主机 名 、 服 务 名 ， 或 者 两 者 都 提供 。 如 采 仅 仅 提供 一 个 名 
另外 一 个 必须 是 一 个 空 指针 。 主 机 名 可 以 是 一 个 节点 名 或 点 分 格式 








的 主机 地 址 。 


getaddrinfo 函 数 返 回 一 个 链表 结构 addrinfo。 可 以 用 freeaddrinfo 来 释 


放 一 个 或 多 个 这 种 结构 ， 这 取决 于 用 ai_next 字 段 链接 起 来 的 结构 有 多 


少 。 


addrinfo 结 构 的 定义 至 少 包 含 以 下 成 员 : 


struct addrinfo { 


int ai_flags; /* customize behavior 
党 / 

int ai_family; /* address family */ 

int ai_socktype; /* socket type */ 

int ai_protocol; /* protocol */ 

socklen_t ai_addrlen; /* length in bytes of 
address */ 

struct sockaddr *ai_addr; /* address */ 

char *ai_canonname; /* canonical name of 
host */ 

struct addrinfo *ai_ next; /* next in list */ 
}; 


可 以 提供 一 个 可 选 的 hint 来 选择 符合 特定 条 件 的 地 址 。hint 是 一 个 用 


于 过 滤 地 址 的 模板 ， 包 括 ai_family、ai_flags、ai_protocol 和 ai_socktype 
字段 。 剩 余 的 整数 字段 必须 设置 为 0， 指 针 字 段 必 须 为 空 。 图 16-7 总 结 
了 ai _flags 字 段 中 的 标志 ， 可 以 用 这 些 标志 来 自 定 义 如 何 处 理 地 址 和 名 
字 。 


AI ADDRCONFIG 得 询 配置 的 地 址 类 型 (IPv4 或 IPv6) 
AI ALL 查找 IPv4 和 了 Pv6 地 址 〈 仅 用 于 AI V4MAPPED) 
AI CANONNAME 需要 一 个 规范 的 名 字 〈 与 别名 相对 ) 


AI NUMERICHOST 以 数字 格式 指定 主机 地 址 ， 不 翻译 

AI NUMERICSERV 将 服务 指定 为 数字 问 口 号 ， 不 翻译 

AI PASSIVE SRE MOLD Fh Tae 

AI VAMAPPED 如 没有 找到 IPv6 地 址 ， 返 回 映射 到 IP v6 格式 的 IPv4 地 址 


图 16-7 addrinfo 结 构 的 标志 
如 果 getaddrinfo 失 败 ， 不 能 使 用 perror 或 strerror 来 生成 错误 消息 ， 而 
是 要 调用 gai_strerror 将 返回 的 错误 码 转换 成 错误 消息 。 
#include <netdb.h> 
const char *gai_strerror(int error); 
返回 值 : Fer DD fe IN a RA SEF E AE 
gethnameinfo 函 数 将 一 个 地 址 转换 成 一 个 主机 名 和 一 个 服务 名 。 
#include <sys/socket.h> 
#include <netdb.h> 
int getnameinfo(const struct sockaddr *restrict addr, socklen_t alen, 
char *restrict host, socklen_t hostlen, 
char *restrict service, socklen_t servlen, int flags); 
返回 值 : RD), JRO; 者 出错， 返回 非 0 值 
套 接 字 地 址 (addr) 被 翻译 成 一 个 主机 名 和 一 个 服务 名 。 如 果 host 
非 空 ， 则 指 同 一 个 长 度 为 hnostlen 字 节 的 缓冲 区 用 于 存放 返回 的 主机 名 。 
同样 ， 如 果 service 非 空 ， 则 指 辣 一 个 长 度 为 servlen 字 市 的 缓冲 区 用 于 存 
放 返 回 的 主机 名 。 
flags 参 数 提供 了 一 些 控制 翻译 的 方式 。 图 16-8 总 结 了 文 持 的 标志 。 











NI_DGRAM 服务 基于 数据 报 而 非 基 于 流 
NI _ NAMEREOD 如 果 找 不 到 主机 名 ， 将 其 作为 一 个 错误 对 行 


NI_NOFQDN 对 于 本 地 主机 ， 仅 返回 全 限定 域名 的 节点 名 部 分 
NI_NUMERICHOST 返回 主机 地 址 的 数字 形式 ， 而 非 主 机 名 
NI_NUMERICSCOPE 对 于 IPv6， 返 回 范围 人 D 的 数字 形式 ， 而 非 名 字 
NI_NUMERICSERV 返回 服务 地 址 的 数字 形式 〈 即 端口 号 )， 而 非 名 字 


图 16-8 getnameinfo 函 数 的 标志 





实例 
图 16-9 说 明了 getaddrinfo 函 数 的 使 用 方法 。 


#include "apue.h" 

#if defined (SOLARIS) 
#include <netinet/in.h> 
fendif 

tinclude <netdb.h> 
finclude <arpa/inet.h> 
tif defined (BSD) 
finclude <sys/socket.h> 
finclude <netinet/in.h> 
tendif 


void 
print_family(struct addrinfo *aip) 
| 
printf (" family "); 
switch (aip->ai family) { 
case AF INET; 


Foi 0 re 
break; 

case AF INETSO: 
pss a eS es} 
break; 

case AF UNIX: 
ES 
break; 

case AF_UNSPEC: 
Printet ("unspecified") 
break; 

default: 
Pmt Ee C™amicnown"™) z 


AN 


AO 


“u 


“M 


Tora 


Pasi nt tm adderet wml 


{ 


pei mEeE™ “Ekrpe. WIS 
Switch (aip->r>ai_socktype) { 
case SOCK_STREAM=: 

Erret ("sbhream™ >.>. 


break; 
case SOCK_DGRAM: 


FE ( aatagrani’™) +> 
break; 

case, SOCR SE 
Printsl (“seqpacke =" hs 


break; 
case SOCK RAW: 
DEERE (ane OS 
break; 
ade fame: 
print unknown CEAI iy 


woid 
Bait a oC ercdehes mS 
{ 
Sa Tr En PEOCOCOL ys 
Sv Gasp Sak. PEOLSOCoLZ) { 
case o: 
peste Gece rae Ise) 2 
break; 
case: TPPROTO TCP- 
pease CTS) 
break; 
case IEPPROTO UDPKP: 
Fe EeE ("ub 2 
break; 
case IPPROTO RAW: 
FE" 
break; 


AO 


` 


AO 


aip-rai_socktype)-; 


taip} 


default: 
printf ("unknown 


void 


(Say; aip->ai_protocol) ;7 


print_flags(struct addrinfo *aip) 


{ 
Panett ("flags") +s 
if (aip->ai_flags == 
printf" OM)? 
} else { 


0) 


if (aip->ai_flags & AI_PASSIVE) 
printf(" passive"); 
if (aip->ai_flags & AI_CANONNAMBE) 


pEintL (™ canon”); 

if (aip->ai_flags & AI_NUMERICHOST) 
printf(" numhost"); 

if (aip->ai_flags & AI_NUMERICSERV) 
printf(" numserv") ; 


if (aip->ai_flags & AI_V4MAPPED) 
printf(" v4mapped") ; 

if (aip->ai_flags & AI_ALL) 
Pree ALE) £ 


wE 


main(int argc, char *argv[]) 


{ 
struct addrinfo 
struct addrinfo 
struct sockaddr_in 
const char 
int 
char 


if (argc != 3) 
err quit ("usage: 


hint.ai_family = 0; 


cat List. al 
hint; 
*Sinp; 
*addr; 
err; 
abuf [INET _ADDRSTRLEN] ; 


Ss nodename service", argv[0O]); 
hint.ai_flags = AI_CANONNAME; 


hint.ai_socktype = 0; 
O; 


hint.ai_protocol = 


hint.ai addrlen = 0; 


hint.ai_canonname = 


hint.ai_addr = NULL; 

hint.ai_next = NULL; 

if ((err = getaddrinfo(argv[1], argv[2], &hint, &ailist) ) 
err_quit ("getaddrinfo error: %s", gai_strerror(err)); 


for (aip = ailist; aip 
print_flags (aip); 
print_family(aip); 


print_type(aip); 


!= NULL; aip = aip->ai_next) 


print_protocol (aip); 
printf("\n\thost $% 


s", aip->ai_canonname?aip—>ai_canonname:"-— 


{ 


mS) E 


1f (aip->al family == AF INET) | 
sinp = (struct sockaddr_in *)aip->ai_addr; 
addr = inet_ntop(AF INET, &sinp->sin addr, abuf, 
INET ADDRSTRLEN) ; 
printf(" address %s", addr?addr:"unknown") ; 
printf(" port sd", ntohs(sinp->sin port) ); 
| 
printf ("\n"); 
| 
exit (0) ; 


图 16-9 打印 主机 和 服务 信息 
这 个 程序 说 明了 getaddrinfo 函数 的 使 用 方法 。 如 果 有 多 个 协议 为 指 
定 的 主机 提供 给 定 的 服务 ， 程 序 会 打印 出 多 条 信息 。 本 实例 仅 打印 了 与 
IPv4 一 起 工作 的 那些 协议 〈ai_family 为 AF_INET) 的 地 址 信息 。 如 果 想 
将 输出 限制 在 AF_INET 协 议 族 ， 可 以 在 提示 中 设置 ai_family 字 段 。 
在 一 个 测试 系统 上 运行 这 个 程序 时 ， 得 到 了 以 下 输出 : 
$ ./a.out harry nfs 
flags canon family inet type stream protocol TCP 
host harry address 192.168.1.99 port 2049 
flags canon family inet type datagram protocol UDP 
host harry address 192.168.1.99 port 2049 





将 一 个 客户 端的 套 接 字 关联 上 一 个 地 址 没有 多 少 新 意 ， 可 以 让 系统 
选 一 个 默认 的 地 址 。 然 而 ， 对 于 服务 器 ， 需 要 给 一 个 接收 客户 端 请 求 的 
服务 器 套 接 字 关 联 上 一 个 众所周知 的 地 址 。 客 户 端 应 有 一 种 方法 来 发 现 
连接 服务 器 所 需要 的 地 址 ， 最 简单 的 方法 就 是 服务 器 保留 一 个 地 址 并 且 
注册 在 /etc/services 或 者 某 个 名 字 服 务 中 。 

使 用 bind 函 数 来 关联 地 址 和 套 接 字 。 


#include <sys/socket.h> 





int bind(int sockfd, const struct sockaddr *addr, socklen_t len); 
返回 值 : ARH, Beo; 大 出 错 ， 返 回 -1 

对 于 使 用 的 地 址 有 以 下 一 些 限制 。 

“在 进程 正在 运行 的 计算 机 上 ， 指 定 的 地 址 必须 有 效 ; 不 能 指定 一 
个 其 他 机 器 的 地 址 。 

地址 必须 和 创建 套 接 字 时 的 地 址 族 所 支持 的 格式 相 [ 匹 配 。 

地 址 中 的 端口 号 必须 不 小 于 1 ”024， 除 非 该 进程 具有 相应 的 特权 

《 即 超级 用 户 ) 。 

一般 只 能 将 一 个 僚 接 字 端 点 绑 定 到 一 个 给 定 地 址 上， 尽管 有 些 协 
议 允 许多 重 绑 定 。 

对 于 因特网 域 ， 如 果 指 定 IP 地 址 为 INADDR_ANY (<netinet/in.h> 中 
定义 的 ) ， 套 接 字 端点 可 以 被 绑 定 到 所 有 的 系统 网 络 接口 上 。 这 意味 着 
可 以 接收 这 个 系统 所 安装 的 任何 一 个 网 卡 的 数据 包 。 在 下 一 节 中 可 以 看 
到 ， 如 果 调 用 connect 或 listen， 但 没有 将 地 址 绑 定 到 套 接 字 上 ， 系 统 会 
选 一 个 地 址 绑 定 到 套 接 字 上 。 

可 以 调用 getsockname 函 数 来 发 现 绑 定 到 套 接 字 上 的 地 址 。 

#include <sys/socket.h> 

int getsockname(int sockfd, struct sockaddr *restrict addr, 

socklen_t *restrict alenp); 
返回 值 : ARH, Beo; 大 出 错 ， 返 回 -1 

调用 getsockname 之 前 ， 将 alenp 设置 为 一 个 指向 整数 的 指针 ， 该 
整数 指定 缓冲 区 sockaddr 的 长 度 。 返 回 时 ， 访 整数 会 被 设置 成 返回 地 址 
的 大 小 。 如 果 地 址 和 提供 的 缓冲 区 长 度 不 匹配 ， 地 址 会 被 自动 截断 而 不 
报错 。 如 果 当 前 没有 地 址 绑 定 到 该 套 接 字 ， 则 其 结果 是 未 定义 的 。 

如 果 套 接 字 已 经 和 对 等 方 连接 ， 可 以 调用 getpeemame 函 数 来 找到 对 
方 的 地 址 。 

#include <sys/socket.h> 

int getpeername(int Sockfd, struct sockaddr *restrict addr, 

socklen_t *restrict alenp); 
返回 值 : ARH, WTO; Fu, e- 
除了 返回 对 等 方 的 地 址 ， 函 数 getpeername 和 getsockname 一 样 。 











16.4 建立 连接 


如 果 要 处 理 一 个 面向 连接 的 网 络 服务 (SOCK_STREAM 或 
SOCK_SEQPACKET) ， 那 么 在 开始 交换 数据 以 前 ， 需 要 在 请 求 服务 的 
进程 套 接 字 【客户 端 ) 和 提供 服务 的 进程 套 接 字 ( 服 务 器 〉 之 间 建 立 一 
个 连接 。 使 用 connect 函 数 来 建立 连接 。 

#include <sys/socket.h> 

int connect(int sockfd, const struct sockaddr *addr, socklen_t len); 

返回 值 : ARH, Beo; 大 出 错 ， 返 回 -1 

在 connect 中 指定 的 地 址 是 我 们 想 与 之 通信 的 服务 器 地 址 。 如 果 
sockfd 没 有 绑 定 到 一 个 地 址 ，connect 会 给 调用 者 绑 定 一 个 默认 地 址 。 

当 演 试 连接 服务 器 时 ， 出 于 一 些 原 因 ， 连 接 可 能 会 失败 。 要 想 一 个 
连接 请 求 成 功 ， 要 连接 的 计算 机 必须 是 开启 的 ， 并 且 正 在 运行 ， 服 务 器 
必须 绑 定 到 一 个 想 与 之 连接 的 地 址 上， 并且 服 务 器 的 等 待 连接 队列 要 有 
足够 的 空间 《后 面 会 有 更 详细 的 介绍 ) 。 因 此 ， 应 用 程序 必须 能 够 处 理 
w 这 些 错误 可 能 是 由 一 些 瞬 时 条 件 引 起 的 。 

SE fl 

图 16-10 显示 了 一 种 如 何 处 理 瞬 时 connect 错误 的 方法 。 如 果 一 个 
服务 器 运行 在 一 个 负载 很 重 的 系统 上 ， 束 很 有 可 能 发 生 这 些 错误 。 





#include "apue.h" 
#include <sys/socket .h> 


#define MAXSLEEP 128 


int 
connect_retry(int sockfd, const struct sockaddr *addr, socklen_t alen) 


int numsec; 


/* 
* Try to connect with exponential backoff. 
外 
for (numsec = 1; numsec <= MAXSLEEP; numsec <<= 1) { 
if (connect (sockfd, addr, alen) == 0) { 
/* 
* Connection accepted, 
4 


return (0) ; 


/+ 
* Delay before trying again. 
i 
if (numsec <= MAXSLEEP/2) 
sleep (numsec) ; 


| 


return(-1); 


图 16-10 支持 重 试 的 connect 
这 个 函数 展示 了 指数 补偿 (exponential backoff) 算法 。 如 果 调 用 
connect 失 败 ， 进 程 会 休眠 一 小 段 时 间 ， 然 后 进入 下 次 循环 再 次 尝试 ， 每 
次 循环 休眠 时 间 会 以 指数 级 增加 ， 直 到 最 大 延迟 为 2 分 钟 左右 。 
然而 图 16-10 中 的 代码 存在 一 个 问题 : 代码 是 不 可 移植 的 。 它 在 
Linux 和 Solaris 上 可 以 工作 ， 但 是 在 FreeBSD 和 Mac OS X EAD fetz THH 
工作 。 在 基于 BSD 的 套 接 字 实现 中 ， 如 果 第 一 次 连接 尝试 失败 ， 那 么 在 





TCP 中 继续 使 用 同一 个 套 接 字 描 述 符 ， 接 下 来 仍旧 会 失败 。 这 就 是 一 个 
协议 相关 的 行为 从 协议 无 关 的 ) 套 接 字 接口 中 显露 出 来 变 得 应 用 程序 
可 见 的 例子 。 这 些 都 是 历史 原因 ， 因 此 Single UNIX Specification 警 告 ， 
如 果 connect 失 败 ， 套 接 字 的 状态 会 变 成 未 定义 的 。 

KE, WR connect 失败 ， 可 迁移 的 应 用 程序 需要 关闭 套 接 字 。 如 
ee 必须 打开 一 个 新 的 套 接 字 。 这 种 更 易于 迁移 的 技术 如 图 16- 
11ATA o 























#include "apue.h" 
#include <sys/socket .h> 


define MAXSLEEP 128 


int 
connect_retry(int domain, int type, int protocol, 
const struct sockaddr *addr, socklen t alen) 


int numsec, fd; 


/+ 
* Try to connect with exponential backoff. 
| 
for (numsec = 1; numsec <= MAXSLEEP; numsec <<= 1) { 
if ((fd = socket (domain, type, protocol)) < 0) 
return (-1); 


if (connect(fd, addr, alen) == 0) { 
/+ 
* Connection accepted, 
af 
return (fd) ; 
close (fd); 


/* 

* Delay before trying again, 

*/ 

if (numsec <= MAXSLEEP/2) 
sleep (numsec) ; 


| 


return (-1); 


图 16-11 可 迁移 的 文 持 重 试 的 连接 代码 

需要 注意 的 是 ， 因 为 可 能 要 建立 一 个 新 的 套 接 字 ， 给 connect_retry 
函数 传递 一 个 套 接 字 擅 述 符 参 数 是 没有 意义 。 我 们 现在 返回 一 个 已 连接 
的 套 接 字 摘 述 符 给 调用 者 ， 而 并 非 返 回 一 个 表示 调用 成 功 的 值 。 

如 果 套 接 字 擅 述 符 处 于 非 阻塞 模式 〈 该 模式 将 在 16.8 节 中 进一步 
讨论 ) ， 那 么 在 连接 不 能 马上 建立 时 ，connect 将 会 返回 -1 并 且 将 errno 
设置 为 特殊 的 错误 码 EINPROGRESS。 应 用 程序 可 以 使 用 poll 或 者 select 
来 判断 文件 描述 符 何 时 可 写 。 如 果 可 写 ， 连 接 完成 。 

connect 函 数 还 可 以 用 于 无 连接 的 网 络 服务 (SOCK_DGRAM) 。 这 
看 起 来 有 点 了 矛盾， 实际 上 却 是 一 个 不 错 的 选择 。 如 果 用 SOCK_DGRAM 
套 接 字 调用 connect， 传 送 的 报 文 的 目标 地 址 会 设置 成 connect 调 用 中 所 
指定 的 地 址 ， 这 样 每 次 传送 报 文 时 就 不 需要 再 提供 地 址 。 男 外 ， 仪 能 接 
收 来 自 指定 地 址 的 报 文 。 

服务 器 调用 listen 函 数 来 宣告 它 愿 意 接受 连接 请 求 。 














#include <sys/socket.h> 
int listen(int sockfd, int backlog); 
返回 值 : ERJ, E0; FRE, Re- 

参数 backlog 提 供 了 一 个 提示 ， 提 示 系 统 该 进程 所 要 入 队 的 未 完成 连 
接 请 求 数量 。 其 实际 值 由 系统 决定 ， 但 上 限 由 <sys/socket.h> 中 的 
SOMAXCONN 指 定 。 

Solaris 系 统 忽 略 了 <sys/socket.h> 中 的 SOMAXCONN。 具 体 的 最 大 
值 取 决 于 每 个 协议 的 实现 。 对 于 TCP， 其 默认 值 为 128。 

一 旦 队列 满 ， 系 统 就 会 拒绝 多 余 的 连接 请 求 ， 所 以 backlog 的 值 应 该 
基于 服务 响 期 望 负 载 和 处 理 量 来 选择 ， 其 中 处 理 量 是 指 接受 连接 请 求 与 
局 动 服务 的 数量 。 

一 旦 服务 器 调用 了 listen， 所 用 的 套 接 字 就 能 接收 连接 请 求 。 使 用 
accept 国 数 获得 连接 请 求 并 建立 连接 。 

#include <sys/socket.h> 

int accept(int sockfd, struct sockaddr *restrict addr, 

socklen_t *restrict len); 
返回 值 : ARRI, BEL ERF) 描述 符 ; 知 出 错 ， 返 回 -1 

函数 accept 所 返回 的 文件 描述 符 是 套 接 字 描 述 符 ， 该 描述 符 连 接 到 
调用 connect 的 客户 端 。 这 个 新 的 套 接 字 描述 符 和 原始 套 接 字 〈sockfd ) 
具有 相同 的 套 接 字 类 型 和 地 址 族 。 传 给 accept 的 原始 套 接 字 没 有 关联 到 
这 个 连接 ， 而 是 继续 保持 可 用 状态 并 接收 其 他 连接 请 求 。 

如 果 不 关心 客户 端 标 识 ， 可 以 将 参数 addr 和 len 设 为 NULL。 和 否则 ， 
在 调用 accept 之 前 ， 将 addr 参 数 设 为 足够 大 的 缓冲 区 来 存放 地 址 ， 并 且 
将 len 指 向 的 整数 设 为 这 个 缓冲 区 的 字 市 大 小 。 返 回 时 ，accept 会 在 绥 冲 
区 填充 客户 端的 地 址 ， 并 且 更 新 指 同 len 的 整数 来 反映 该 地 址 的 大 小 。 

如 果 没 有 连接 请 求 在 等 待 ，accept 会 阻塞 直到 一 个 请 求 到 来 。 如 果 
sockfd 处 于 非 阻塞 模式 ， ”accept 会 返回 -1， 并 将 ermo 设 置 为 EAGAIN 或 
EWOULDBLOCK. 

本 文中 讨论 的 所 有 平台 都 将 EAGAIN 定 义 为 EWOULDBLOCK。 

如 果 服 务 器 调用 accept， 并 且 当 前 没有 连接 请 求 ， 服 务 器 会 阻 罕 直 
到 一 个 请 求 到 来 。 男 外 ， 服 务 器 可 以 使 用 poll 或 select 来 等 待 一 个 请 求 的 
来 。 在 这 种 情况 下 ， 一 个 市 有 等 待 连接 请 求 的 套 接 字 会 以 可 读 的 方式 

现 。 

实例 

图 16-12 显 示 了 一 个 函数 ， 可 以 用 来 分 配 和 初始 化 套 接 字 供 服务 器 
进程 使 用 。 





























finclude "apue ,hn 
finclude <errno.h> 
finclude <sys/socket .h> 


int 
initserver(int type, const struct sockaddr *addr, socklen t alen, 
int glen) 
| 
int fd; 
int err = 0; 


if ((fd = socket (addr->sa family, type, 0)) < 0) 
return (-1) ; 

if (bind(fd, addr, alen) < 0) 
goto errout; 

if (type == SOCK_STREAM || type == SOCK SEQPACKET) { 
if (listen(fd, glen) < 0) 

goto errout; 
return (fd); 


errout: 
err = errno; 
close (fd) ; 
errno = err; 
return(-1); 








图 16-12 初始 化 一 个 套 接 字 端 点 供 服务 器 进程 使 用 
可 以 看 到 ，TCP 有 一 些 奇怪 的 地 址 复 用 规则 ， 这 使 得 这 个 例子 不 完 
备 。 图 16-22 显 示 了 有 关 这 个 函数 的 为 一 个 版 本 ， 可 以 绕 过 这 些 规 则 ， 
解决 此 版本 的 主要 缺陷 。 
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既然 一 个 套 接 字 端点 表示 为 一 个 文件 描述 符 ， 那 么 只 要 建立 连接 ， 
就 可 以 使 用 read 和 write 来 通过 套 接 字 通 信 。 回 忆 前 面 所 讲 ， 通 过 在 
connect ”函数 里 面 设置 默认 对 等 地 址 ， 数 据 报 套 接 字 也 可 以 被 “连接 ”。 
在 套 接 字 描述 符 上 使 用 read 和 write 是 非常 有 意义 的 ， 因 为 这 意味 着 可 以 
将 套 接 字 摘 述 符 传递 给 那些 原先 为 处 理 本 地 文件 而 设计 的 函数 。 而 且 还 
人 而 该 子 进程 执行 的 程序 并 不 了 

尽管 可 以 通过 read 和 write 交换 数据 ， 但 这 就 是 这 两 个 函数 所 能 做 的 
一 切 。 如 果 想 指定 选项 ， 从 多 个 客户 端 接收 数据 包 ， 或 者 发 送 带 外 数 
据 ， 就 需要 使 用 6 个 为 数据 传递 而 设计 的 套 接 字 函 数 中 的 一 个 。 

3 个 函数 用 来 发 送 数据 ，3 个 用 于 接收 数据 。 首 先 ， 考 查 用 于 发 送 数 
据 的 函数 。 

最 简单 的 是 send， 它 和 write 很 像 ， 但 是 可 以 指定 标志 来 改变 处 理 传 
输 数 据 的 方式 。 

#include <sys/socket.h> 

ssize_t send(int sockfd, const void *buf, size_t nbytes, int flags); 

返回 值 : 知 成 功 ， 返 回 发 送 的 字 节 数 ; A, e- 

类 似 write， 使 用 send 时 套 接 字 必 须 已 经 连接 。 参 数 buf 和 nbytes 的 含 
义 与 write 中 的 一 致 。 

然而 ， 与 write 不 同 的 是 ，send 文 持 第 4 个 参数 flags。3 个 标志 是 由 
Single UNIX Specification 定 义 的 ， 但 是 具体 系统 实现 文 持 其 他 标志 的 情 
况 也 是 很 常见 的 。 图 16-13 总 结 了 这 些 标志 。 
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Fuse COWFTRM | EARN REL 持 地 址 肌 
HAR 

MSG DONTROUTE | 。 勿 将 数据 包 路 由 出 本 地 网 络 

MSG DONTWAIT | 允许 非 阻塞 操作 (等 价 于 使 用 
0 NONBLOCK) 


MSG BOF 发 送 数据 后 关闭 套 按 字 的 发 送 站 

MSG_EOR 如 果 协 议 支持 ， 标 记 记录 结束 

MSG MORE 延 发 送 数 据 包 多 许 写 更 多 数据 

MSG NOSIGNAL | 在 写 无 连接 的 套 接 字 时 不 产生 
SIGPIPE 信号 

MSG 00B 如 果 协 议 支持 ， 发 送 带 外 数据 

( 见 16.7 节 ) 


























图 16-13 send 套 接 字 调用 标志 

即使 snd 成 功 返 回 ， 也 并 不 表示 连接 的 另 一 问 的 进程 就 一 定 接 收 了 
数据 。 我 们 所 能 保证 的 只 是 当 send 成 功 返 回 时 ， 数 据 已 经 被 无 错误 地 发 
送 到 网 络 驱 动 程 序 上 。 

对 于 文 持 报 文 边界 的 协议 ， 如 果 答 试 发 送 的 单个 报 文 的 长 度 超过 协 
议 所 文 持 的 最 大 长 度 ， 那 么 send 会 失败 ， 并 将 ermo 设 为 EMSGSIZE 。 对 
于 字 节 流 协议 ，send 会 阻塞 直到 整个 数据 传输 完成 。 函 数 sendto 和 send 
很 类 似 。 区 别 在 于 sendto 可 以 在 无 连接 的 套 接 字 上 指定 一 个 目标 地 址 。 

#include <sys/socket.h> 

ssize_t sendto(int sockfd, const void *buf, size_t nbytes, int flags, 

const struct sockaddr *destaddr, socklen_t destlen); 
返回 值 : ARJ, BERZE Aue, e- 

对 于 面向 连接 的 套 接 字 ， 目 标 地 址 是 被 忽略 的 ， 因 为 连接 中 隐 含 了 
目标 地 址 。 对 于 无 连接 的 套 接 字 ， 除 非 先 调用 connect 设 置 了 目标 地 址 ， 
否则 不 能 使 用 send。sendto 提 供 了 发 送 报 文 的 另 一 种 方式 。 

通过 和 套 接 字 发 送 数据 时 ， 还 有 一 个 选择 。 可 以 调用 带 有 msghdr 结 构 

















的 sendmsg 来 指定 多 重 缓冲 区 传输 数据 ， 这 和 writev 函 数 很 相似 〈 见 14.6 
es es 


#include <sys/socket.h> 

ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags); 
POSIX.1 定 义 了 msghdr 结 构 ， 它 至 少 有 以 下 成 员 : 

struct msghdr { 


void *msg_name; /* optional address */ 

socklen_t msg_namelen; /* address size in bytes */ 

struct iovec *msg_iov; /* array of I/O buffers */ 

int msg_iovlen; /* number of elements in 
array */ 

void *msg_control; /* ancillary data */ 

socklen_t msg_controllen; /* number of ancillary bytes */ 

int msg_flags; /* flags for received 
message */ 


’ 


在 14.6 节 中 可 以 看 到 iovec 结 构 。 在 17.4 节 中 可 以 看 到 辅助 数据 的 使 
函数 recv 和 read 相 似 ， 但 是 recv 可 以 指定 标志 来 控制 如 何 接收 数据 。 


#include <sys/socket.h> 


ssize_t recv(int sockfd, void *buf, size_t nbytes, int flags); 
返回 值 ， 返 回 数 据 的 字 节 长 度 ; EHAR EA ATK PP aOR 
图 16-14 总 结 了 这 些 标志 。 仅 有 3 个 标志 是 Single UNIX Specification 
定义 的 。 
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USG CHG CLOENEC | CMSG CLOEXEC | UNIX Brocco ce | 上 接收 的 
文件 描述 符 AEAEE 
志 ( 见 174 节 ) 

MSG_DONTWAIT BATE (HATE 
用 0 NONBLOCK) 

MSG. ERRQUEUE 接收 错误 信息 作为 辅助 数据 

MSG 00B 如 果 协 议 支持 ， 获 取 市 外 数 
据 CH 16.71) 

MSG PEEK 返回 数据 包 内 容 而 不 真正 取 
走 数据 包 

MSG. TRUNC 即使 数据 包 被 截断 ， 也 返回 
数据 包 的 实际 长 度 

MSG WAITALL 等 待 直到 所 有 的 数据 可 用 ( 仅 
SOCK STREAM) 


图 16-14 recv 套 接 字 调用 标志 
当 指 定 MSG_PEEK 标 志 时 ， 可 以 查看 下 一 个 要 读 取 的 数据 但 不 真正 
取 走 它 。 当 再 次 调用 read 或 其 中 一 个 recv 函 数 时 ， 会 返回 刚才 查看 的 数 


据 。 

对 于 SOCK_STREAM 套 接 字 ， 接 收 的 数据 可 以 比 预期 的 少 。 
MSG_WAITALL 标 志 会 阻止 这 种 行为 ， 直 到 所 请 求 的 数据 全 部 返回 ， 
recv ý ALA Zik [Al 对 于 SOCK_DGRAM 和 SOCK_SEQPACKET 套 接 
字 ， en _WAITALL 标志 没有 改变 什么 行为 ， 因 为 这 些 基于 报 文 的 套 
接 字 类 型 一 次 读 取 就 返回 整个 报 文 。 

a ( 见 16.2 节 ) 来 结束 传输 ， 或 者 网 络 
协议 支持 按 默 认 的 顺序 关闭 并 且 发 送 端 已 经 关闭 ， 那 么 当 所 有 的 数据 接 
收 完毕 后 ，recv 会 返回 0。 

i 兴趣 定位 发 送 者 ， 可 以 使 用 recvfrom 来 得 到 数据 发 送 者 的 源 
地 址 。 


#include <sys/socket.h> 
ssize_t recvfrom(int sockfd, void *restrict buf, size_t len, int flags, 
struct sockaddr *restrict addr, 
socklen_t *restrict addrlen); 
返回 值 ， 返 回 数 据 的 字 节 长 度 ; 大 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 
返回 0; 知 出 错 ， 返回 -1 

如 果 addr 非 空 ， 它 将 包含 数据 及 送 者 的 僚 接 字 端 点 地 址 。 当 调用 
recvfrom 时 ， 需 要 设置 addrlen 参 数 指向 一 个 整数 ， 该 整数 包含 addr 所 指 
mere: IESE. WII, WB AE Se 
KEE 

因为 可 以 获得 发 送 者 的 地 址 ，recvfrom 通 常用 于 无 连接 的 套 接 字 。 
否则 ，recvfrom 等 同 于 recv。 

为 了 将 接收 到 的 数据 送 入 多 个 缓冲 区 ， 类 似 于 readv〈 见 14.6 节 ) ， 
或 者 想 接 收 辅助 数据 〈 见 17.4 节 ) ， 可 以 使 用 recvmsg。 

#include <sys/socket.h> 

ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags); 
返回 值 : 返回 数据 的 字 节 长 度 ， 帮 无 可 用 数据 或 对 等 方 已 经 按 序 结 

返回 0; 知 出 错 ， 返回 -1 

recvmsg 用 msghdr 结 构 〈 在 sendmsg 中 见 到 过 ) 指定 接收 数据 的 输入 
绥 冲 区 。 可 以 设置 参数 flags 来 改变 recvmsg 的 默认 行为 。 返 回 时 ， 
msghdr 结 构 中 的 msg_flags 字 段 被 设 为 所 接收 数据 的 各 种 特征 。 GEA 
recvmsg 时 msg_flags 被 忽略 。) recvmsg 中 返回 的 各 种 可 能 值 总 结 在 图 
16-15 中 。 我 们 将 在 第 17 章 看 到 使 用 recvmsg 的 实例 。 实 例 : 面向 连接 的 


客户 端 
R FreeBSD | ,. MacOS | Solaris 
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MSG CTRUNC | 控制 数据 被 截断 

MSG EOR 接收 记录 结束 符 
MSG_PRROUEUE | 接收 错误 信息 作为 辅助 数 折 
MSG 00B 接收 带 外 数据 
MSG_TRUNC 地 数据 做 截断 


图 16-15 从 recvmsg 中 返回 的 msg_flags 标 志 





图 16-16 显 示 了 一 个 与 服务 器 通信 的 客 尸 端 从 系统 的 uptime 命 令 获 得 
输出 。 我 们 把 这 个 服务 称 为 “远程 正常 运行 时 间 ”(remote uptime) (fj 
写 为 “ruptime”) 。 








#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket.h> 


#define BUFLEN 128 


extern int connect_retry(int, int, int, const struct sockaddr *, 
socklen 七 ) ， 


void 
print_uptime(int sockfd) 
{ 

int rie 

char buf [BUFLEN] ; 


while ((n = recv(sockfd, buf, BUFLEN, 0)) > 0) 
write (STDOUT FILENO, buf, n); 

if (n < 0) 
err_sys("recv error"); 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err; 


if (argc != 2) 

err_quit("usage: ruptime hostname") ; 
memset (&hint, 0, sizeof (hint)); 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 


if ((err = getaddrinfo (argv[1], "ruptime", &hint, Sailist)) != 0) 
err quit ("getaddrinfo error: %s", gai_strerror(err)); 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 


if ((sockfd = connect_retry(aip->ai_family, SOCK_STREAM, 0, 
aip->ai_addr, aip->ai_addrlen)) < 0) { 
err = errno; 
} else { 
print_uptime (sockfd) ; 
exit(0); 


} 


err exit (err, "can't connect to %s", argv[1]); 





图 16-16 用 于 从 服务 器 获取 正常 运行 时 间 的 客户 端 命 令 

这 个 程序 连接 服务 器 ， 读 取 服 务 器 发 送 过 来 的 字符 串 并 将 其 打印 到 
标准 输出 。 因 为 使 用 的 是 SOCK_STREAM 套 接 字 ， 所 以 不 能 保证 调用 
一 次 recv 就 会 读 取 整个 字符 串 ， 因 此 需要 重复 调用 直到 它 返 回 0。 

如 果 服 务 器 文 持 多 重 网 络 接口 或 多 重 网 络 协议 ， 函 数 getaddrinfo 可 
能 会 返回 多 个 候选 地 址 供 使 用 。 轮 法 尝 试 每 个 地 址 ， 当 找到 一 个 允许 连 
接 到 服务 的 地 址 时 便 可 停止 。 使 用 图 16-11 中 的 connect_retry 了 水 数 来 与 服 
务 器 建立 一 个 连接 。 

实例 : 面 癌 连接 的 服务 器 

图 16-17 展 示 了 服务 器 程序 ， 用 来 提供 uptime 命 令 的 输出 到 图 16-16 
所 示 的 客户 病程 序 。 





#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <syslog.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define QLEN 10 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 
#endif 


extern int initserver(int, const struct sockaddr *, socklen_t, int); 
void 


serve (int sockfd) 


{ 


int cria; 
FILE J 
char buf [BUFLEN] ; 


set_cloexec(sockfd) ; 
for (77) { 
if ((clfd = accept (sockfd, NULL, NULL)) < 0) { 
syslog(LOG_ERR, "ruptimed: accept error: %s", 
strerror (errno) ); 
exit (1); 
} 
set_cloexec(clfd); 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf (buf, "error: %s\n", strerror(errno)); 
send(clfd, buf, strlen(buf), 0); 
} else { 
while (fgets(buf, BUFLEN, fp) != NULL) 
send(clfd, buf, strlen(buf), 0); 
pclose (fp); 
} 
close (clfd) ; 


int 
main(int argc, char *argv[]) 
{ 
struct addrinfo tallist, *aip?} 


struct addrinfo hint; 


int sockfd, err, n; 
char *host; 
if (argc != 1) 


err quit ("usage: ruptimed") ; 
if ((n = sysconf(_SC_HOST NAME MAX)) < 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err_sys("malloc error"); 
if (gethostname(host, n) < 0) 
err_sys("gethostname error"); 
daemonize ("ruptimed") ; 
memset (&hint, 0, sizeof (hint)); 
hint.ai_flags = AI_CANONNAME; 
hint.ai_socktype = SOCK STREAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) != 0) { 
syslog (LOG_ERR, "ruptimed: getaddrinfo error: %s", 
gai_strerror (err) ); 
exit (1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver (SOCK STREAM, aip->ai_addr, 
aip->ai_addrlen, QLEN)) >= 0) { 
serve (sockfd) ; 
exit (0); 


} 
exit (1); 





图 16-17 提供 系统 正常 运行 时 间 的 服务 器 程序 

为 了 找到 它 的 地 址 ， 服 务 器 需要 获得 其 运行 时 的 主机 名 。 如 果 主 机 
名 的 最 大 长 度 不 确定 ， 可 以 使 用 HOST_NAME_MAX 代 蔡 。 如 果 系 统 没 
定义 HOST_NAME_MAX， 可 以 自己 定义 。POSIX.1 要 求 主机 名 的 最 大 
长 度 至 少 为 255 字 节 ， 不 包括 终止 null 字 符 ， 因 此 定义 
HOST_NAME_MAX 为 256 来 包括 终止 null 字 符 。 

服务 器 调用 gethostname 获 得 主机 名 ， 碍 看 远程 正常 运行 时 间 服 务 的 
地 址 。 可 能 会 有 多 个 地 址 返回 ， 但 我 们 简单 地 选择 第 一 个 来 建立 被 动 套 
接 字 端点 〈 即 一 个 只 用 于 监听 连接 请 求 的 地 址 ) 。 处 理 多 个 地 址 作为 习 
题 留 给 读者 。 

使 用 图 16-12 的 initserver 函 数 来 初始 化 套 接 字 端点 ， 在 这 个 端点 上 等 
待 到 来 的 连接 请 求 。( 实 际 上 ， 使 用 的 是 图 16-22 的 版 本 ; 在 16.6 市 中 讨 
论 套 接 字 选项 时 ， 可 以 了 解 其 中 的 原因 。) 

实例 : 另 一 个 面向 连接 的 服务 器 

前 面 说 过 ， 采 用 文件 描述 符 来 访问 套 接 字 是 非常 有 意义 的 ， 因 为 它 
允许 程序 对 联网 环境 的 网 络 访问 一 无 所 知 。 图 16-18 中 所 示 的 服务 器 程 
序 版 本 说 明了 这 一 点 。 服 务 器 没有 从 uptime 命 令 中 读 取 输出 并 发 送 到 客 
户 端 ， 而 是 将 uptime 命 令 的 标准 输出 和 标准 错误 安排 成 为 连接 到 客户 端 
的 套 接 字 端点 。 
































#include 
#include 
#include 
#include 
#include 
#include 
#include 





"apue.h" 
<netdb.h> 
<errno.h> 
<syslog.h> 
<fcntl.h> 
<sys/socket.h> 
<sys/wait.h> 


#define QLEN 10 


#ifndef HOST_NAME MAX 
#define HOST NAME MAX 256 


fendif 


extern int initserver(int, const struct sockaddr *, socklen_t, int); 


void 


serve (int sockfd) 


{ 


int 


pid_t 


clfd, status; 
pid; 


set cloexec (sockfd) ; 


for (77) 
if ((clfd = accept (sockfd, NULL, NULL)) < 0) 


{ 


{ 
syslog(LOG_ERR, “ruptimed: accept error: %s", 
strerror (errno) ); 
exit(1); 


if ((pid = fork()) < 0) { 


syslog(LOG_ERR, “ruptimed: fork error: %s", 
strerror (errno) ); 
exit(1); 


} else if (pid == 0) { /* child */ 


/* 

* The parent called daemonize (Figure 13.1), so 

* STDIN_FILENO, STDOUT_FILENO, and STDERR_FILENO 

* are already open to /dev/null. Thus, the call to 
* close doesn't need to be protected by checks that 
* clfd isn't already equal to one of these values. 
ay 


if (dup2(clfd, STDOUT_FILENO) != STDOUT_FILENO | | 
dup2(clfd, STDERR_FILENO) != STDERR_FILENO) { 
syslog(LOG_ERR, "ruptimed: unexpected error"); 
exit (1); 


} 
close (clfd); 
execl ("/usr/bin/uptime", "uptime", (char *)0); 


syslog(LOG_ERR, "ruptimed: unexpected return from exec: 


strerror (errno) ); 


} else { /* parent */ 


close (clfd); 
waitpid(pid, &status, 0); 


ss", 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err, n; 
char *host; 


if (arge != 1) 
err_quit("usage: ruptimed") ; 
if ((n = sysconf(_SC_HOST_NAME MAX)) < 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname (host, n) < 0) 
err_sys("gethostname error"); 
daemonize ("ruptimed") ; 
memset (&hint, 0, sizeof (hint) ); 
hint.ai_flags = AI_CANONNAME; 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, f&ailist)) != 0) 
syslog(LOG_ERR, "ruptimed: getaddrinfo error: %s", 
gai_strerror(err)); 
exit (1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK_STREAM, aip->ai_addr, 
aip->ai_addrlen, QLEN)) >= 0) { 
serve (sockfd) ; 
exit (0); 


} 
exit (1); 

















图 16-18 用 于 说 明 命令 直接 写 到 套 接 字 的 服务 器 程序 

我 们 没有 采用 popen 来 运行 uptime 命 令 ， 并 从 连接 到 命令 标准 输出 
的 管道 读 取 输出 ， 而 是 采用 fork 创 建 了 一 个 子 进 程 ， 然 后 使 用 dup2 使 
STDIN_FILENO 的 子 进程 副本 对 /dev/null 开 放 ， 使 STDOUT_FILENO 和 
STDERR_FILENO 的 子 进程 副本 对 套 接 字 端点 开放 。 当 执行 uptime 时 ， 
命令 将 结果 写 到 它 的 标准 输出 ， 访 标准 输出 是 连接 到 套 接 字 的 ， 所 以 数 
据 被 送 到 ruptime 客 户 端 命令 。 

父 进程 可 以 安全 地 关闭 连接 到 客户 端的 文件 摘 述 符 ， 因 为 子 进程 仍 
旧 让 它 打 开 着 。 父 进程 会 等 待 子 进程 处 理 完毕 再 继续 ， 所 以 子 进程 不 会 
变 成 僵 死 进程 。 由 于 运行 uptime 命 令 不 会 花 婉 太 长 的 时 间 ， 所 以 父 进程 
在 接受 下 一 个 连接 请 求 之 前 ， 可 以 等 待 子 进程 退出 。 然 而 ， 如 果子 进程 
运行 的 时 间 比 较 长 的 话 ， 这 种 策略 就 未 必 适 合 了 。 

前 面 的 实例 采用 的 都 是 面 癌 连接 的 套 接 字 。 但 如 何 选择 合适 的 套 接 
字 类 型 呢 ? 何 时 采用 面向 连接 的 套 接 字 ， 何 时 采用 无 连接 的 套 接 字 呢 ? 
答案 取决 于 我 们 要 做 的 工作 量 和 能 够 容忍 的 出 错 程度 。 

对 于 无 连接 的 套 接 字 ， 数 据 包 到 达 时 可 能 已 经 没有 次 序 ， 因 此 如 果 
不 能 将 所 有 的 数据 放 在 一 个 数据 包 里 ， 则 在 应 用 程序 中 就 必须 关心 数据 
包 的 次 序 。 数 据 包 的 最 大 尺寸 是 通信 协议 的 特征 。 男 外 ， 对 于 无 连接 的 
套 接 字 ， 数 据 包 可 能 会 丢失 。 如 果 应 用 程序 不 能 容忍 这 种 丢失 ， 必 须 使 
用 面向 连接 的 套 接 字 。 

容忍 数据 包 于 失意 味 着 两 种 选择 。 一 种 选择 是 ， 如 果 想 和 对 等 方 可 
靠 通信 ， 就 必须 对 数据 包 编 号 ， 并 且 在 发 现 数据 包 丢 失 时 ， 请 求 对 等 应 
用 程序 重 传 ， 还 必须 标识 重复 数据 包 并 丢弃 它们 ， 因 为 数据 包 可 能 会 延 
迟 或 疑似 丢失 ， 可 能 请 求 重 传 之 后 ， 它 们 又 出 现 了 。 

另 一 种 选择 是 ， 通 过 让 用 户 再 次 答 试 那个 命令 来 处 理 错误 。 对 于 简 
单 的 应 用 程序 ， 这 可 能 就 足够 了 ， 但 对 于 复杂 的 应 用 程序 ， 这 种 选择 通 
党 不 可 行 。 因 此 ， 一 般 在 这 种 情况 下 使 用 面 癌 连接 的 套 接 字 比较 好 。 

面 问 连接 的 套 接 字 的 缺陷 在 于 需要 更 多 的 时 间 和 工作 来 建立 一 个 连 
接 ， 并 且 每 个 连接 都 需要 消耗 较 多 的 操作 系统 资源 。 

实例 : 无 连接 的 客户 端 
人 
























































#include "apue.h" 
include <netdb.h> 
include <errno.h> 
include <sys/socket .h> 


#define BUFLEN 128 
#define TIMEOUT 20 


void 

Sigalrm(int signo) 
| 

} 


void 
print_uptime(int sockfd, struct addrinfo *aip) 
| 

int cH 

char buf [BUFLEN] ; 


buf [0] = 0; 

if (sendto(sockfd, buf, 1, 0, aip->ai addr, aip->ai_addrlen) < 0) 
err sys ("sendto error"); 

alarm(TIMEOUT); 

if ((n = recvfrom(sockfd, buf, BUFLEN, 0, NULL, NULL)) < 0) { 
if (errno != EINTR) 

alarm(0); 

err sys ("recv error"); 

} 

alarm(0); 

write (STDOUT FILENO, buf, n); 


int 
main(int argc, char *argv[]) 


{ 


struct addrinfo Fallisty “alp; 
struct addrinfo hint; 

int sockfd, err; 
struct sigaction sa; 

if (argc != 2) 


err quit ("usage: ruptime hostname"); 

sa.Sa_handler = sigalrm; 

sa.sa flags = 0; 

sigemptyset (&Sa.sa_mask) ; 

if (sigaction(SIGALRM, &sa, NULL) < 0) 
err sys ("sigaction error"); 

memset (&hint, 0, sizeof (hint)); 

hint.ai_socktype = SOCK_DGRAM; 

hint.ai_canonname = NULL; 

hint.al_addr = NULL; 

hint.ai_next = NULL; 

if ((err = getaddrinfo(argv(1], "ruptime", &hint, &ailist)) != 0) 
err_quit ("getaddrinfo error: ss", gai strerror (err)); 


for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = socket (aip->ai_family, SOCK DGRAM, 0)) < 0) { 
err = errno; 
} else { 
print_uptime(sockfd, aip); 
exit (0); 


fprintf(stderr, "can't contact %s: s\n", argv[1], strerror(err)); 
exit (1); 








图 16-19 采用 数据 报 服务 的 客户 端 命 令 

除了 增加 安装 一 个 SIGALRM 的 信号 处 理 程序 以 外 ， 基 于 数据 报 的 
客户 端 中 的 main 函 数 和 面 癌 连接 的 客户 端 中 的 类 似 。 使 用 alarm 函 数 来 
避免 调用 recvfrom 时 的 无 限期 阻塞 。 

对 于 面向 连接 的 协议 ， 需 要 在 交换 数据 之 前 连接 到 服务 器 。 对 于 服 
务 喜 来 说 ， 到 来 的 连接 请 求 已 经 足够 判断 出 所 需 提供 给 客户 端的 服务 。 
但 是 对 于 基于 数据 报 的 协议 ， 需 要 有 一 种 方法 通知 服务 器 来 执行 服务 。 
本 例 中 ， 只 是 简单 地 同 服 务 器 发 送 了 1 字 节 的 数据 。 服 务 器 将 接收 它 ， 
从 数据 包 中 得 到 地 址 ， 并 使 用 这 个 地 址 来 传送 它 的 响应 。 如 果 服 务 器 提 
供 多 个 服务 ， 可 以 使 用 这 个 请 求 数据 来 表示 需要 的 服务 ， 但 由 于 服务 器 
只 做 一 件 事 情 ，1 字 节 数 据 的 内 容 是 无 关 紧 要 的 。 

如 果 服 务 器 不 在 运行 状态 ， 客 户 端 调 用 recvfrom 便 会 无 限期 阻塞 。 
对 于 这 个 面 同 连接 的 实例 ， 如 果 服 务 器 不 运行 ，connect 调用 会 失败 。 
为 了 避免 无 限期 阻塞 ， 可 以 在 调用 recvfrom 之 前 设置 警告 时 钟 。 

实例 : 无 连接 的 服务 占 

图 16-20 所 示 的 程序 是 uptime 服 务 器 的 数据 报 版 本 。 




















#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <syslog.h> 
#include <sys/socket.h> 


#define BUFLEN 128 
#define MAXADDRLEN 256 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 
fendif 


extern int initserver(int, const struct sockaddr *, socklen t, 
void 


serve (int sockfd) 
{ 


int n; 

socklen t alen; 

FILE *fp; 

char buf [BUFLEN] ; 

char abuf [MAXADDRLEN] ; 


struct sockaddr *addr = (struct sockaddr *)abuf; 


set_cloexec (sockfd) ; 
for (77) { 
alen = MAXADDRLEN; 


ifit)'; 


if ((n = recvfrom(sockfd, buf, BUFLEN, 0, addr, é&alen)) < 0) 


syslog(LOG_ERR, "ruptimed: recvfrom error: %s", 
strerror (errno) ); 
exit (1); 
} 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf (buf, "error: %s\n", strerror (errno)); 
sendto(sockfd, buf, strlen (buf), 0, addr, alen); 
} else { 
if (fgets (buf, BUFLEN, fp) != NULL) 


sendto(sockfd, buf, strlen (buf), 0, addr, alen); 


pclose (fp); 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo *ai list, taip; 
struct addrinfo hint; 
int sockfd, err, n; 


{ 


char *host; 


if (argc != 1) 
err quit("usage: ruptimed") ; 
if ((n = sysconf(_SC_HOST NAME MAX)) < 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname(host, n) < 0) 
err_sys("gethostname error"); 
daemonize ("ruptimed") ; 
memset (&hint, 0, sizeof (hint) ); 
hint.ai_flags = AI_CANONNAME; 
hint.ai_socktype = SOCK_DGRAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, Gailist)) != 0) 
syslog (LOG_ERR, "ruptimed: getaddrinfo error: %s", 
gai_strerror(err)); 
exit (1); 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver (SOCK DGRAM, aip->ai_addr, 
alp->ai_addrlen, 0)) >= 0) { 
serve (sockfd) ; 
exit (0); 


} 
exit (1); 


本 





图 16-20 基于 数据 报 提供 系统 正常 运行 时 间 的 服务 器 

服务 器 在 recvfrom 阻 塞 等 竺 服务 请 求 。 当 一 个 请 求 到 达 时 ， 保 存 请 

求 者 地 址 并 使 用 popen 来 运行 uptime 命 令 。 使 用 sendto 函 数 将 输出 友 送 到 
客户 端 ， 将 目标 地 址 设置 成 刚才 的 请 求 者 地 址 。 








16.6 套 接 字 选 项 


套 接 字 机 制 提供 了 两 个 套 接 字 选项 接口 来 控制 套 接 字 行 为 。 一 个 接 
口 用 来 设置 选项 ， 男 一 个 接口 可 以 查询 选项 的 状态 。 可 以 获取 或 设置 以 
下 3 种 选项 。 
(1) 通用 选项 ， 工 作 在 所 有 套 接 字 类 型 上 。 
(2) 在 套 接 字 层次 管理 的 选项 ， 但 是 依赖 于 下 层 协议 的 文 持 。 
(3) 特定 于 某 协议 的 选项 ， 每 个 协议 独 有 的 。 
Single UNIX Specification 定义 了 套 接 字 层 的 选项 (上述 选 项 中 的 前 
两 个 选项 类 型 ) 
可 以 使 用 iodo 数 来 设置 套 接 字 选项 。 
#include <sys/socket.h> 
int setsockopt(int sockfd, int level, int option, const void *val, 
socklen_t len); 




















BREE: AA, IO; 奎 出 错 ， 返 回 -1 
参数 level 标识 了 选项 应 用 的 协议 。 如 果 选 项 是 通用 的 套 接 字 层次 
选项 ， 则 level 设置 成 SOL_SOCKET。 奉 则 ，level 设 置 成 控制 这 个 选项 
的 协议 编号 。 对 于 TCP 选 项 ，level 是 IPPROTO_TCP， 对 于 IJP，level 是 
IPPROTO_IP。 图 16-21 总 结 了 Single UNIX Specification 中 定义 的 通用 套 
接 字 层次 选项 。 





S0_ACCEPTCONN 
SO BROADCAST 
590_DPBUC 
S0_DONTROUTE 
90_ERROR 

SO KEEPALIVE 
S0_LINGER 
90_OOBINLINE 
S0_RCVBUF 

SO RCVLOWAT 
S0_RCVTIMEO 
90_REUSEADDR 
90_SNDBUF 
S0_SNDLOWAT 
S0_SNDTIMEO 
90_TYPE 


参数 val 根 据 选 项 的 不 同 指 同一 个 数据 结构 或 者 一 个 整数 。 


参数 val 的 类 型 








struct linger 
int 
int 
int 
struct timeval 
int 
int 
int 
struct timeval 


int 


ae ERRUER Fe SREB 〈 仅 getsockopt) 
如 果 xval 非 0， 广 播 数据 报 

如 果 xval 非 0， 局 用 网 络 驱 动 调试 功能 

如 果 #val 非 0， 统 过 通常 路 由 

返回 挂 起 的 套 接 学 错误 并 清除 ( 仅 getsockopt ) 
如 果 xval 非 0， 忆 用 周期 性 keep-alive RX 
SAAR ERE CAM, 1ER 
如 果 *val 非 0， 将 带 外 煞 据 放 在 普通 数据 中 
接收 缓冲 区 的 字 节 长 度 

接收 调用 中 返回 的 最 小 数据 字 书 煞 

BEPC AINE 

如 果 xval 非 0， 重 用 bind 中 的 地 址 

发 送 缓冲 区 的 字 节 长 度 

发 送 调用 中 传送 的 最 小 数据 字 池 数 

套 按 字 发 送 调用 的 超时 值 

标识 套 接 字 类 型 ( 仅 getsockopt) 





图 16-21 BR FM 


是 on/off 开 关 。 如 果 整 数 非 0， 则 局 用 选项 。 如 果 整 数 为 0， 则 茶 
。 参数 len 指 定 了 val 指 向 的 对 象 的 大 小 。 
可 以 使 用 getsockopt 函 数 来 得 看 选项 的 当前 值 。 


#include <sys/socket.h> 


a 


int getsockopt(int sockfd, int level, int option, void *restrict val, 
socklen_t *restrict lenp); 
返回 值 : ARH, Eo; 大 出 错 ， 返 回 -1 
参数 lenp 是 一 个 指向 整数 的 指针 。 在 调用 getsockopt 之 前 ， 设 置 该 整 


数 为 复制 选项 缓冲 区 的 长 度 。 如 果 选 项 的 实际 长 度 大 于 此 值 ， 则 选项 会 
如 果实 际 长 度 正 好 小 于 此 值 ， 那 么 返回 时 将 此 值 更 新 为 实际 长 
实例 
当 服 务 器 终止 并 尝试 立即 重启 时 ， 图 16-12 中 的 函数 将 无 法 正常 工 
作 。 通 常情 况 下 ， 除 非 超 时 (超时 时 间 一 般 是 几 分 钟 )， 否 则 TCP 的 实 
现 不 允许 绑 定 同一 个 地 址 。 幸 运 的 是 ， 套 接 字 选项 SO_REUSEADDR 可 
以 绕 过 这 个 限制 ， 如 图 16-22 所 示 。 








#include "apue,h" 
#include <errno.h> 
finclude <sys/socket .h> 


int 


initserver(int type, const struct sockaddr *addr, socklen_t alen, 


int glen) 
| 
int fd, err; 
int reuse = 1; 


if ((fd = socket (addr->sa_ family, type, 0)) < 0) 
return (-1) ; 
if (setsockopt(fd, SOL SOCKET, SO REUSEADDR, éreuse, 
sizeof (int)) < 0) 
goto errout; 
if (bind(fd, addr, alen) < 0) 
goto errout; 
if (type == SOCK STREAM || type == SOCK _SEQPACKET) 
if (listen(fd, glen) < 0) 
goto errout; 
return (fd); 


errout; 
err = errno; 
close (fd); 
errno = err; 
return(-1); 


图 16-22 采用 地 址 复 用 初始 化 套 接 字 端 点 供 服务 器 使 用 
为 了 局 用 SO_REUSEADDR 选 项 ， 设 置 了 一 个 非 0 值 的 整数 ， 并 把 
这 个 整数 地 址 作为 val 参 数 传递 给 了 setsockopt。 将 len 参 数 设置 成 了 一 个 
整数 大 小 来 表明 val 所 指 的 对 象 的 大 小 。 


16.7 市 外 数据 


带 外 数据 (out-of-band data)〉 是 一 些 通 信 协 议 所 支持 的 可 选 功能 ， 
与 普通 数据 相 比 ， 它 允许 更 高 优先 级 的 数据 传输 。 带 外 数据 先行 传输 ， 
即使 传输 队列 已 经 有 数据 。TCP 支持 带 外 数据 ， 但 是 UDP 不 文 持 。 套 接 
字 接 口 对 带 外 数据 的 支持 很 大 程度 上 受 TCP 带 外 数据 具体 实现 的 影响 。 

TCP 将 带 外 数据 称 为 紧急 数据 Curgent data) 。TCP 仅 支持 一 个 字 节 
的 紧急 数据 ， 但 是 允许 紧急 数据 在 普通 数据 传递 机 制 数据 流 之 外 传输 。 
为 了 产生 紧急 数据 ， 可 以 在 3 个 send 函 数 中 的 任何 一 个 里 指定 MSG_OOB 
标志 。 如 果 带 MSG_OOB 标 志 发 送 的 字 节 数 超 过 一 个 时 ， 最 后 一 个 字 节 
将 被 视 为 紧急 数据 字 节 。 

如 果 通 过 套 接 字 安排 了 信和 号 的 产生 ， 那 么 紧急 数据 被 接收 时 ， 会 发 
送 SIGURG 信 号 。 在 3.14 节 和 14.5.2 节 中 可 以 看 到 ， 在 fcntl 中 使 用 
F_SETOWN 命 令 来 设置 一 个 套 接 字 的 所 有 权 。 如 果 fcnt 中 的 第 三 个 参数 
为 正 值 ， 那 么 它 指定 的 就 是 进程 ID。 如 果 为 非 -1 的 负 值 ， 那 么 它 代表 的 
就 是 进程 组 ID。 因此 ， 可 以 通过 调用 以 下 函数 安排 进程 接收 套 接 字 的 信 
号 ; 





fcntl(sockfd, F_SETOWN, pid); 

F_GETOWN 命 令 可 以 用 来 获得 当前 套 接 字 所 有 权 。 对 于 
F_SETOWN 命 令 ， 负 值 代 表 进 程 组 ID， 正 值 代表 进程 ID。 因 此 ， 调 用 

owner = fcntl(sockfd, F_GETOWN, 0); 

将 返回 owner， 如 果 owner 为 正 值 ， 则 等 于 配置 为 接收 套 接 字 信和 号 的 
进程 的 ID。 如 果 owner 为 负 值 ， 其 绝对 值 为 接收 套 接 字 信号 的 进程 组 的 
ID. 

TCP 支 持 紧 急 标 记 Curgent mark) 的 概念 ， 即 在 普通 数据 流 中 紧急 
数据 所 在 的 位 置 。 如 果 采 用 套 接 字 选项 SO_OOBINLINE， 那 么 可 以 在 
普通 数据 中 接收 紧急 数据 。 为 帮助 判断 是 否 已 经 到 达 紧 急 标 记 ， 可 以 使 
用 函数 sockatmark。 

#include <sys/socket.h> 

int sockatmark(int sockfd); 

BEE: tepid, ikl; 知 没 在 标记 处 ， 返 回 0; 知 出 错 ， 返 回 -1 

当下 一 个 要 读 取 的 字 节 在 紧急 标志 处 时 ，sockatmark 返 回 1。 

当 带 外 数据 出 现在 套 接 字 读 取 队列 时 ，select 函 数 〈 见 14.4.1 节 ) 会 
返回 一 个 文件 描述 符 并 且 有 一 个 待 处 理 的 异常 条 件 。 可 以 在 普通 数据 流 











上 接收 紧急 数据 ， 也 可 以 在 其 中 一 个 recv 函 数 中 采用 MSG_OOB 标 志 在 
其 他 队列 数据 之 前 接收 紧急 数据 。TCP 队 列 仅 用 一 个 字 节 的 紧急 数据 。 
如 果 在 接收 当前 的 紧急 数据 字 市 之 前 义 有 新 的 紧急 数据 到 来 ， 那 么 已 有 
NF AREF 





16.8 宏和 异步 IO 


通常 ，recv 函数 没有 数据 可 用 时 会 阻塞 等 待 。 同 样 地 ， 当 套 接 字 输 
出 队列 没有 足够 空间 来 发 送 消息 时 ，send 函数 会 阻塞 。 在 套 接 字 非 阻 塞 
模式 下 ， 行 为 会 改变 。 在 这 种 情况 下 ， 这 些 函 数 不 会 阻塞 而 是 会 失败 ， 
将 errmo 设 置 为 EWOULDBLOCK 或 者 EAGAIN。 当 这 种 情况 发 生 时 ， 可 
以 使 用 pol 或 select 来 判断 能 否 接收 或 者 传输 数据 。 
Single UNIX Specification 包含 通用 异步 JO 机 制 〈 见 14.5 节 ) 的 文 
持 。 套 搂 字 机 制 有 其 自己 的 处 理 异 步 JO 的 方式 ， 但 是 这 在 Single UNIX 
Specification 中 没有 标准 化 。 一 些 文献 把 经 典 的 基于 套 接 字 的 异 a 
制 称 为 “基于 信号 的 VO”， 区 别 于 Single UNIX specification 中 的 通 重用 异步 
IO 机 制 | 。 
在 基于 套 接 字 的 异步 WO 中 ， 当 从 套 接 字 中 读 取 数据 时 ， 或 者 当 套 
接 字 写 队 列 中 空间 变 得 可 用 时 ， 可 以 安排 要 发 送 的 信号 SIGIO。 启 用 异 
步 1/O 是 一 个 两 步 又 的 过 程 。 
(1) 建立 套 接 字 所 有 权 ， 这 样 信号 可 以 被 传递 到 合适 的 进程 。 
(2) 通知 套 接 字 当 IO 操 作 不 会 阻塞 时 发 信和 号。 
可 以 使 用 3 种 方式 来 完成 第 一 个 步 又 。 
(1) 在 fentl 中 使 用 F_SETOWN 命 令 af 
(2) 在 ioctl 中 使 用 FIOSETOWN 命 an a 
— 在 ioctl 中 使 用 SIOCSPGRP 命 令 。 
完成 第 二 个 步骤 ， 有 两 个 选择 。 
et 在 fon 中 使 用 F SETFL 命 令 并 且 局 用 文件 标志 O- ASYNC. 
(2) 在 ioctl 中 使 用 FIOASYNC 命 令 。 
虽然 有 多 种 选项 ， 但 它们 没有 得 到 普遍 支持 。 图 16-23 总 结 了 本 文 
讨论 的 平台 支持 这 些 选 项 的 情况 。 

















fcntl fentl (fd, F SETON, pid) F SETOWN, pid) 


loctl (fd, FIOSETOWN, pid) 
ioctl (fd, SIOCSPGRP, pid) 


tl(fd, F SETFL, flags|0_ASYNC) 
tl(fd, FIOASYNC, &n); 


图 16-23 套 接 字 异 步 JO 管 理 
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16.9 小 结 


本 章 考 察 了 IPC 机 制 ， 这 些 机 制 允许 进程 与 不 同 计算 机 上 的 以 及 同 
一 计算 机 上 的 其 他 进程 通信 。 我 们 讨论 了 和 套 接 字 端 点 如 何 命名 ， 在 连接 
服务 圳 时 ， 如 何 发 现 所 用 的 地 址 。 

我 们 给 出 了 采用 无 连接 的 〈 即 基于 数据 报 的 ) 套 接 字 和 面向 连接 的 
套 接 字 的 客户 端 和 服务 器 的 实例 ， 还 简要 讨论 了 异步 和 非 阻塞 的 套 接 字 
IO， 以 及 用 于 管理 套 接 字 选 项 的 接口 。 

下 一 章 将 会 考察 一 些 高 级 IPC 主 题 ， 包 括 在 同一 台 计 算 机 上 如 何 使 
用 和 套 接 字 在 两 个 进程 之 间 传送 文件 描述 符 。 





习题 


16.1 写 一 个 程序 判断 所 使 用 系统 的 字 节 序 。 

16.2 写 一 个 程序 ， 在 至 少 两 种 不 同 的 平台 上 打印 出 所 支持 套 接 字 的 
stat 结构 成 员 ， 并 且 描 述 这 些 结果 的 不 同 之 处 。 

16.3 ”图 16-17 的 程序 只 在 一 个 端点 上 提供 了 服务 。 修 改 这 个 程序 ， 
同时 文 持 多 个 端点 《每 个 端点 具有 一 个 不 同 的 地 址 ) 上 的 服务 。 

16.4 写 一 个 客户 端 程 序 和 服务 端 程序 ， 返 回 指定 主机 上 当前 运行 的 
进程 数量 。 

16.5 在 图 16-18 的 程序 中 ， 服 务 嚣 等待 子 进程 执行 uptime， 子 进程 完 
成 后 退出 ， 服 务 器 才 接 受 下 一 个 连接 请 求 。 重 新 设计 服务 器 ， 使 得 处 理 
一 个 请 求 时 并 不 拖延 处 理 到 来 的 连接 请 求 。 

16.6 ” 写 两 个 库 例 程 ， 一 个 在 套 接 字 上 人 允许 异步 JO， 一 个 在 套 接 字 
上 不 允许 异步 WO。 使 用 图 16-23 来 保证 函数 能 够 在 所 有 平台 上 运行 ， 并 
有 旦 支持 尽 可 能 多 的 套 接 字 类 型 。 














17.1515 


前 面 两 章 讨 论 了 UNIX 系统 提供 的 各 种 IPC， 其 中 包括 管道 和 套 接 
字 。 本 章 介绍 一 种 高 级 IPC 一 UNIX 域 套 接 字 机 制 ， 并 说 明 它 的 应 用 方 
法 。 这 种 形式 的 IPC 可 以 在 同一 计算 机 系统 上 运行 的 两 个 进程 之 间 传 送 
打开 文件 描述 符 。 服 务 进程 可 以 使 它们 的 打开 文件 描述 符 与 指定 的 名 字 
相关 联 ， 同 一 系统 上 运行 的 客户 进程 可 以 使 用 这 些 名 字 与 服务 器 进程 汇 
R. 0 进程 提供 一 个 独 用 的 
IPC 通 道 。 





17.2 UNIX} EF 


UNIX 域 套 接 字 用 于 在 同一 台 计 算 机 上 运行 的 进程 之 间 的 通信 。 虽 
然 因特网 域 套 接 字 可 用 于 同一 目的 , 但 UNIX 域 套 接 字 的 效率 更 高 。 
UNIX 域 套 接 字 仅仅 复制 数据 ， 它 们 并 不 执行 协议 处 理 ， 不 需要 添加 或 
删除 网 络 报头 ， 无 需 计 算 校 验 和 ， 不 要 产生 顺序 号 ， 无 需 发 送 确认 报 
W 

UNIX 域 套 接 字 提供 流 和 数据 报 两 种 接口 。UNIX 域 数据 报 服 务 是 
可 靠 的 ， 既 不 会 丢失 报 文 也 不 会 传递 出 错 。UNIX 域 套 接 字 束 像 是 套 接 
字 和 管道 的 混合 。 可 以 使 用 它们 面向 网 络 的 域 套 接 字 接口 或 者 使 用 
socketpair 函 数 来 创建 一 对 无 命名 的 、 相 互 连 接 的 UNIX 域 套 接 字 。 

#include <sys/socket.h> 

int socketpair(int domain, int type, int protocol, int sockfd[2]); 

虽然 接口 足够 通用 ， 人 允许 socketpair 用 于 其 他 域 ， 但 一 般 来 说 操作 系 
统 仅 对 UNIX 域 提供 支持 。 

一 对 相互 连接 的 UNIX 域 套 接 字 可 以 起 到 全 双 工 管道 的 作用 : 两 端 
对 读 和 写 开 放 《〈 见 图 17-1) 。 我 们 将 其 称 为 fd 管道 〈fd-pipe) ， 以 便 与 
普通 的 半 双 工 管道 区 分 开 来 。 




















用 户 进程 






fd[0] fd[1] 






图 17-1 套 接 字 对 


实例 ，fd_pipe 函 数 
图 17-2 展 示 了 fd_pipe 函 数 ， 它 使 用 socketpair 函 数 来 创建 一 对 相互 连 
接 的 UNIX 域 流 套 接 字 。 


include "apue,h" 
#include <sys/socket .h> 


/* 
* Returns a full-duplex pipe (a UNIX domain socket) with 
* the two file descriptors returned in fd[0] and fd[1], 
a 
int 
fd pipe (int fd[2]) 
| 
return (socketpair (AF UNIX, SOCK STREAM, 0, fd)); 








图 17-2 创建 一 个 全 双 工 管道 

某 些 基于 BSD 的 系统 使 用 UNIX 域 套 接 字 来 实现 管道 。 但 当 调 用 pipe 
时 ， 第 一 摘 述 符 的 写 端 和 第 二 摘 述 符 的 读 端 都 是 关闭 的 。 为 了 得 到 全 双 
工 管道 ， 必 须 直 接 调用 socketpair。 

实例 : 借助 UNIX 域 套 接 字 轮 询 XSI 消 妃 队 列 

15.6.4 节 曾经 提 到 XSI 消 息 队 列 的 使 用 存在 一 个 问题 ， 即 不 能 将 它们 
和 poll 或 者 select 一 起 使 用 ， 这 是 因为 它们 不 能 关联 到 文件 描述 人 符 。 然 
而 ， 套 接 字 是 和 文件 描述 符 相 关联 的 ， 消 息 到 达 时 ， 可 以 用 套 接 字 来 通 
知 。 对 每 个 消息 队列 使 用 一 个 线程 。 每 个 线程 都 会 在 msgrcv 调 用 中 阻 
塞 。 当 消息 到 达 时 ， 线 程 会 把 它 写 入 一 个 UNIX 域 套 接 字 的 一 端 。 当 poll 
指示 套 接 字 可 以 读 取 数 据 时 ， 应 用 程序 会 使 用 这 个 套 接 字 的 另外 一 端 来 
接收 这 个 消息 。 

图 17-3 中 的 程序 说 明了 这 个 技术 。main 函 数 中 创建 了 一 些 消 息 队 列 
和 UNIX 域 套 接 字 ， 并 为 每 个 消息 队列 开 司 了 一 个 新 线程 。 然 后 它 在 一 




















个 无 限 循 环 中 用 poll 来 轮 询 选择 一 个 套 接 字 端 点 。 当 茶 个 套 接 字 可 读 
时 ， 程 序 可 以 从 套 接 字 中 读 取 数据 并 把 消息 打印 到 标准 输出 上 。 





finclude "apue ,ha 
tinclude <poll.h> 
tinclude <pthread.h> 
finclude <sys/msg.h> 








finclude <sys/socket.h> 


tdefine MO 3 /* number of queues */ 
fdefine MAXMSZ 512 /* maximum message size */ 
tdefine KEY 0x123 /* key for first message queue */ 


struct threadinfo { 
int qid; 
int fd; 


struct mymesg { 
long mtype; 
char mtext [MAXMSZ]; 


void * 

helper (void *arg) 

| 
int ny 
struct mymesg m; 


struct threadinfo *tip = arg; 


for (;;) 


{ 


memset (&ém, 0, sizeof (m)); 
if ((n = msgrev(tip->qid, &m, MAXMSZ, 0, MSG_NOERROR)) < 0) 


err_sys("msgrcv error"); 


if (write(tip->fd, m.mtext, n) < 0) 


int 


err_sys("write error"); 


ip Rp, ere 
fd[2]; 
gid [NO]; 


struct pollfd pfd[NQ]; 
struct threadinfo ti[NQ]; 
pthread_t tid [NQ]; 


char 


for (i = 
((qid[i] = msgget((KEY+i), IPC_CREAT|0666)) < 0) 


aid i 


buf [MAXMSZ] ; 


O; i < NO; i++) { 


err_sys("msgget error"); 


printf ("queue ID %d is d\n", i, qid[i]); 


if 


(socketpair (AF_UNIX, SOCK_DGRAM, 0, fd) < 0) 


err_sys("socketpair error"); 


pfd[i].fd = fd[0]; 
pfd[i].events = POLLIN; 
ti Lil soid = qid[i]; 
ti[i].fd = fa[lys 


if 


for (7;) 
LE 


for 


exit (0); 


((err = pthread_create(&tid[i], NULL, helper, &ti[i])) != 0) 


err_exit(err, "pthread_create error"); 


{ 


(poll(pfd, NQ, -1) < 0) 


err_sys("poll error"); 
(i, = Of a < NOs itt) { 
if (pfd[i].revents & POLLIN) { 
if ((n = read(pfd[i].fd, buf, sizeof(buf))) < 0) 
err sys ("read error"); 
buf[n] = 0; 
printf ("queue id %d, message %s\n", qid[i], buf); 


Le | 

















图 17-3 使 用 UNIX 域 套 接 字 轮 询 XSI 消 息 队 列 
注意 ， 我 们 使 用 的 是 数据 报 〈SOCK_DGRAM) 套 接 字 而 不 是 流 套 
接 字 。 这 样 做 可 以 保持 消息 边界 ， 以 保证 从 套 接 字 里 一 次 只 读 取 一 条 消 
自 








这 种 技术 可 以 〈 非 直接 地 ) 在 消息 队列 中 运用 poll 或 者 select。 只 要 
为 每 个 队列 分 配 一 个 线程 的 开销 以 及 每 个 消息 额外 复制 两 次 〈 一 次 写 入 
套 接 字 ， 男 一 次 从 套 接 字 里 读 取 出 来 ) 的 开销 是 可 接受 的 ， 这 种 技术 就 
会 使 XSI 消 息 队 列 的 使 用 更 加 容易 。 

使 用 图 17-4 中 所 示 的 程序 给 图 17-3 中 所 示 的 测试 程序 发 送 消 息 。 


#include "apue.h" 


#include <sys/msg.h> 


#define MAXMSZ 512 


struct mymesg { 


int 


long mtype; 
char mtext [MAXMSZ]; 


main(int argc, char *argv[]) 


key_t key; 

long qid; 

size_t nbytes; 
struct mymesg m; 


if (argc != 3) { 
fprintf(stderr, "usage: sendmsg KEY message\n") ; 
exit (1); 

} 

key = strtol(argv[1], NULL, 0); 

if ((gid = msgget (key, 0)) < 0) 
err sys("can't open queue key %s", argv[1]); 

memset (&m, 0, sizeof(m)); 

strncpy(m.mtext, argv(2], MAXMSZ-1); 

nbytes = strlen(m.mtext) ; 

m.mtype = 1; 

if (msgsnd(qid, &m, nbytes, 0) < 0) 
err_sys("can't send message"); 

exit (0); 





图 17-4 给 XSI 消 息 队 列 发 送 消息 

这 个 程序 需要 两 个 参数 : 消息 队列 关联 的 键 值 以 及 一 个 包含 消息 主 
体 的 字符 串 。 发 送 消息 到 服务 器 端 时 ， 它 会 打印 如 下 信息 : 

$ ./pollmsg & 在 后 台 运 行 服务 
器 [1] 12814 

$ queue ID 0 is 196608 

queue ID 1 is 196609 

queue ID 2 is 196610 

$ ./sendmsg 0x123 "hello, world" 给 第 一 个 队列 发 送 一 
条 消息 

queue id 196608, message hello, world 

$ ./sendmsg 0x124 "just a test" 给 第 二 个 队列 发 送 一 条 
消息 

queue id 196609, message just a test 

$ ./sendmsg 0x125 "bye" 给 第 三 个 队列 发 送 
一 条 消息 

queue id 196610, message bye 

命名 UNIX 域 套 接 字 

虽然 socketpair 函数 能 创建 一 对 相互 连接 的 套 接 字 ， 但 是 每 一 个 套 
接 字 都 没有 名 字 。 这 意味 着 无 关 进 程 不 能 使 用 它们 。 

在 16.3.4 节 中 学 习 了 如 何 将 一 个 地 址 绑 定 到 一 个 因特网 域 套 接 字 
上 。 恰 如 因特网 域 套 接 字 一 样 ， 可 以 命名 UNIX 域 套 接 字 ， 并 可 将 其 用 
于 告示 服务 。 但 是 要 注意 ，UNIX 域 套 接 字 使 用 的 地 址 格式 不 同 于 因 特 
网 域 套 接 字 。 

回忆 16.3 节 ， 套 接 字 地 址 格式 会 随 实 现 而 变 。UNIX 域 套 接 字 的 地 
址 由 sockaddr_un 结 构 表 示 。 在 Linux 3.2.0 和 Solaris 10 中 ，sockaddr_un 结 
构 在 头 文 件 <sys/un.h> 中 的 定义 如 下 : 


struct sockaddr un { 











sa family t sun_family; /* AF UNIX */ 
char sun_path[108]; /* pathname */ 
}; 
但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ，sockaddr_un 结 构 的 定义 
如 下 : 
struct sockaddr_un { 
unsigned char sun_len; /* sockaddr length */ 
sa_family_t sun_family; /* AF UNIX */ 


char sun_path[104]; /* pathname */ 


is 

sockaddr_ un 结构 的 sun_path 成 员 包 含 一 个 路 径 名 。 当 我 们 将 一 个 地 
址 绑 定 到 一 个 UNIX 域 套 接 字 时 ， 系 统 会 用 该 路 径 名 创建 一 个 S_IFSOCK 
类 型 的 文件 。 

该 文件 仅 用 于 辐 客 户 进程 告示 套 接 字 名 字 。 该 文件 无 法 打开 ， 也 不 
能 由 应 用 程序 用 于 通信 。 

如 果 我 们 试图 绑 定 同一 地 址 时 ， 该 文件 已 经 存在 ， 那 么 bind 请 求 会 
失败 。 当 关闭 套 接 字 时 ， 并 不 自动 删除 该 文件 ， 所 以 必须 确保 在 应 用 程 
序 退出 对 该 文件 执行 解除 链接 操作 。 

SE pl 

图 17-5 所 示 的 程序 是 一 个 将 地 址 绑 定 到 UNIX 域 套 接 字 的 例子 。 

运行 此 程序 时 ，bind 请 求 成 功 执行 。 但 是 ， 大 第 二 次 运行 该 程序 ， 
则 出 错 返 回 ， 其 原因 是 该 文件 已 经 存在 。 在 删除 该 文件 之 前 ， 该 程序 不 
会 再 成 功 运行 。 

$ ./a.out 运行 该 
程序 

UNIX domain socket bound 

$ ls -l foo.socket BA ETE 
字 文 件 

STWXIW-XI-X 1 sar 0 May 18 00:44 foo.socket 

$ ./a.out 试图 再 
次 运行 该 程序 

bind failed: Address already in use 

$ rm foo.socket 删除 该 
套 接 字 文 件 

$ ./a.out pet yi 
运行 该 程序 

UNIX domain socket bound 现在 
成 功 啦 




















finclude "apue.h" 
#include <sys/socket ,h> 
finclude <sys/un.h> 


int 
main (void) 
| 
int fd, size; 
struct sockaddr_un un; 


un. sun family = AF UNIX; 
strcpy(un.sun_path, "foo.socket") ; 
if ((fd = socket (AF UNIX, SOCK STREAM, 0)) < 0) 
err sys("socket failed"); 
size = offsetof (struct sockaddr un, sun path) + strlen(un.sun_path); 
if (bind(fd, (struct sockaddr *)&un, size) < 0) 
err sys ("bind failed"); 
printf ("UNIX domain socket bound\n"); 
exit (0); 


图 17-5 将 地 址 绑 定 到 UNIX 域 套 接 字 

确定 绑 定 地 址 长 度 的 方法 是 ， 先 计算 sun_path 成 员 在 sockaddr_un 结 
构 中 的 偶 移 量 ， 然 后 将 结果 与 路 径 名 长 度 〈 不 包括 终止 null 字 符 ) 相 
加 。 因 为 sockaddr_un 结 构 中 sun_path 之 前 的 成 员 与 实现 相关 ， 所 以 我 们 
使 用 <stddef.h> 头 文件 〈 包 括 在 apue.h 中 ) 中 的 offsetof 宏 计算 sun_path 成 
员 从 结构 开始 处 的 偏 移 量 。 如 果 查 看 <stddef.h>， 则 可 见 到 类 似 于 下 列 
形式 的 定义 : 

#define offsetof(TYPE, MEMBER) ((int)&((TYPE *)0)->MEMBER) 

假定 该 结构 从 地 址 0 开始 ， 此 表达 式 求 得 成 员 起 始 地 址 的 整 型 值 。 














17.3 唯一 连 担 


服务 器 进程 可 以 使 用 标准 bind、listen 和 accept 函 数 ， 为 客户 进程 安 
排 一 个 唯一 UNIX 域 连接 。 客 户 进程 使 用 connect 与 服务 器 进程 联系 。 在 
服务 占 进 程 接 受 了 connect 请 求 后 ， 在 服务 器 进程 和 客户 进程 之 间 就 存在 
了 唯一 连接 。 这 种 风格 的 操作 与 我 们 在 图 16-16 和 图 16-17 中 所 示 的 对 因 
特 网 域 套 接 字 的 操作 相同 。 

图 17-6 展 示 了 客户 进程 和 服务 器 进程 存在 连接 之 前 二 者 的 情形 。 服 
务 器 端 把 它 的 套 接 字 绑 定 到 sockaddr_ un 的 地 址 并 监听 新 的 连接 请 求 。 图 
17-7 展 示 了 在 服务 器 端 接受 客户 端 连接 请 求 后 ， 客 户 端 和 服务 器 问 之 间 
建立 的 唯一 的 连接 。 

现在 ， 我 们 将 开发 3 个 函数 ， 使 用 这 些 函 数 可 以 在 运行 于 同一 台 计 
算 机 上 的 两 个 无 关 进 程 之 间 创 建 唯一 连接 。 这 些 函 数 模仿 了 在 16.4 节 
中 讨论 过 的 面向 连接 的 套 接 字 函数 。 这 里 ， 我 们 将 UNIX 域 套 接 字 应 用 














于 后 层 通 信 机 制 。 
服务 器 进程 





图 17-6 connect 之 前 的 客户 端 


套 接 字 和 服务 器 端 套 接 字 


服务 器 进程 客户 进程 





图 17-7 connect 之 后 的 客户 端 
套 接 字 和 服务 器 端 套 接 字 
#include "apue.h" 
int serv_listen(const char *name); 
返回 值 : ARJ, GRIT ASC AAAS; A J TIE 
int serv_accept(int listenfd, uid_t *uidptr); 
int cli_conn(const char *name); 
返回 值 : 知 成 功 ， 返 回 新 文件 描述 符 ; 者 出 错 ， 返 回 负 值 
返回 值 : RD), DCA: at, Jello 
服务 器 进程 可 以 调用 serv_listen 函 数 《〈 见 图 17-8) 声明 它 要 在 一 个 众 
所 周知 的 名 字 《 文 件 系统 中 的 某 个 路 径 名 ) 上 监听 客户 进程 的 连接 请 
求 。 当 客户 进程 想 要 连接 至 服务 器 进程 时 ， 它 们 将 使 用 该 名 字 。 
listen 冰 数 的 返回 值 是 用 于 接收 客户 进程 连接 请 求 的 服务 器 UNIX 域 
= ae 
服务 器 进程 可 以 使 用 serv_accept 函 数 〈 见 图 17-9) 等 符 客 户 进程 连 
接 请 求 的 到 达 。 当 一 个 请 求 到 达 时 ， 系 统 自动 创建 一 个 新 的 UNIX 域 套 
接 字 ， 并 将 它 与 客户 端 套 接 字 连 接 ， 最 后 将 这 个 新 套 接 字 返 回 给 服务 
器 。 此 外 ， 客 户 进程 的 有 效用 户 ID 存放 在 uidptr 指 向 的 存储 区 中 。 
客户 进程 调用 cli_ conn 函 数 〈 见 图 17-10) 连接 至 服务 器 进程 。 客 户 
进程 指定 的 name 参 数 必 须 与 服务 髓 进程 调用 serv_listen 函 数 时 所 用 的 名 
字 相 同 。 函 数 返 回 时 ， 客 己 进 程 得 到 接连 至 服务 器 进程 的 文件 描述 符 。 








图 17-8 给 出 了 serv_listen 函 数 。 


include "apue,h" 
include <sys/socket .h> 














f 
i 
#include <sys/un.h> 
#include <errno.h> 


define QLEN 10 


/+ 

* Create a server endpoint of a connection, 
* Returns fd if all OK, <0 on error. 

t/ 

int 

serv listen(const char *name) 

| 


int fd, len, err, rval; 


struct sockaddr_un un; 


if (strlen(name) >= sizeof(un.sun_path)) { 
errno = ENAMETOOLONG; 
return(-1); 


/* create a UNIX domain stream socket */ 
if ((fd = socket (AF UNIX, SOCK_STREAM, 0)) < 0) 
return (-2); 


unlink (name) ; /* in case it already exists */ 


/* fill in socket address structure */ 

memset (&un, 0, sizeof(un)); 

un.sun_family = AF_UNIX; 

strcpy(un.sun_path, name); 

len = offsetof(struct sockaddr_un, sun_path) + strlen(name) ; 


/* bind the name to the descriptor */ 

if (bind(fd, (struct sockaddr *)&un, len) < 0) { 
rval = -3; 
goto errout; 


if (listen(fd, QLEN) < 0) { /* tell kernel we're a server */ 
rval = -4; 
goto errout; 

} 

return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return (rval); 


图 17-8 serv_listen 函数 
首先 ， 调 用 socket 创 建 一 个 UNIX 域 套 接 字 。 然 后 将 欲 赋 给 套 接 字 的 
众所周知 的 路 径 名 填 入 sockaddr_un 结 构 。 该 结构 是 调用 bind 的 参数 。 注 
意 ， 不 需要 设置 某 些 平台 提供 的 sun_len 字 段 ， 因 为 操作 系统 会 用 传送 给 
bind 函 数 的 地 址 长 度 设 置 该 字段 。 
最 后 ， 调 用 listen 函 数 〈 见 16.4 节 ) 来 通知 内 核 该 进程 将 作为 服务 器 
进程 等 待 客户 进程 的 连接 请 求 。 当 收 到 一 个 客户 进程 的 连接 请 求 后 ， 服 
务 器 进程 调用 serv_accept 函 数 〈 见 图 17-9) 。 


finclude "apue.h" 
include <sys/socket.h> 


f 

tinclude <sys/un.h> 
tinclude “time ,h> 

ij 














include <errno.h> 


#define STALE 30 /* client's name can't be older than this (sec) */ 


* Wait for a client connection to arrive, and accept it. 
* We also obtain the client's user ID from the pathname 
* that it must bind before calling us. 
* Returns new fd if all OK, <0 on error 
E 

int 

serv_accept (int listenfd, uid_t *uidptr) 

{ 


int elLiftd,, arr, tyak; 
socklen 七 len; 

time_t staletime; 

struct sockaddr_un un; 

Struct Stat statbuf; 

char *name; 


/* allocate enough space for longest name plus terminating null */ 


if ((name = malloc(sizeof(un.sun_path) + 1)) == NULL) 
return (-1); 
len = sizeof(un); 


if ((clifd = accept(listenfd, (struct sockaddr *)&un, &len)) < 0) i 
free (name) ; 
return (-2); /* often errno=EINTR, if signal caught */ 


/* obtain the client's uid from its calling address */ 


len -= offsetof(struct sockaddr_un, sun_path); /* len of pathname */ 
memcpy (name, un.sun_path, len); 
name[len] = 0; /* null terminate */ 
if (stat(name, &statbuf) < 0) { 
rval = -3; 


goto errout; 


#ifdef S_ISSOCK /* not defined for SVR4 */ 
if (S_ISSOCK(statbuf.st_mode) == 0) { 
rval = -4; /* not a socket */ 


goto errout; 


} 


fendif 
if ((statbuf.st_mode & (S_IRWXG | S_IRWXO)) || 
(statbuf.st_mode & S_IRWXU) != S_IRWXU) { 
rval = -5; /* is not rwx------ */ 


goto errout; 


staletime = time (NULL) - STALE; 
if (statbuf.st_atime < staletime || 
statbuf.st_ctime < staletime || 
statbuf.st_mtime < staletime) { 
rval = -6; /* i-node is too old */ 
goto errout; 


if (uidptr != NULL) 


*uidptr = statbuf.st_uid; /* return uid of caller */ 
unlink(name);  /* we're done with pathname now */ 
free (name) ; 





return (clifd) ， 


errout: 
err = errno; 
close (clifd) ; 
free (name) ; 
errno = err; 


return (rval); 





图 17-9 serv_accept A žk 

服务 器 进程 在 调用 serv_accept 中 阻塞 ， 等 竺 一 个 客户 进程 调用 
cli conn。 从 accept 返 回 时 ， 返 回 值 是 连接 到 客户 进程 的 轿 新 的 描述 符 。 
另外 ，accept 函 数 也 经 由 其 第 二 个 参数 〈 指 同 sockaddr_ un 结构 的 指针 ) 
返回 客户 进程 赋 给 其 套 接 字 的 路 径 名 〈 包 含 客户 进程 ID 的 名 字 ) 。 接 
者 ， 程 序 复制 这 个 路 径 名 ， 并 确保 它 是 以 null 终 止 的 《如果 路 径 名 占用 
了 sockaddr_un 结 构 里 的 sun_path 成 员 所 有 的 可 用 空间 ， 那 就 没有 空间 存 
放 终 止 null 字 符 ) 。 然 后 ， 调 用 stat 函 数 验证 : 该 路 径 名 确实 是 一 个 套 接 
字 ; 其 权限 仅 允 许 用 户 读 、 用 户 写 以 及 用 户 执行 。 还 要 验证 与 套 接 字 相 
关联 的 3 个 时 间 参 数 不 比 当前 时 间 早 30 秒 。 (回忆 6.10 节 ，time 函 数 返回 
当前 时 间 和 日 期 ， 用 公元 1970 年 1 月 1 日 00:00:00 以 来 经 过 的 秒 数 表 
Axo.) 

如 知 通 过 了 所 有 这 些 检 验 ， 则 可 认为 客户 进程 的 身份 《其 有 效用 户 
ID) 是 该 套 接 字 的 所 有 者 。 虽 然 这 种 检验 并 不 完善 ， 但 这 是 对 当前 系统 
所 能 做 到 的 最 佳 方案 。 (如 车 内 核能 通过 accept 的 参数 返回 有 效用 户 
ID， 则 会 更 好 一 些 。) 

客户 进程 调用 di_conn 函 数 〈( 见 图 17-10〉 对 连 到 服务 器 进程 的 连接 
进行 初始 化 。 














finclude "apue ,hn 

村 nclude《SyYS/Socket ,h> 
#include <sys/un.h> 
finclude <errno.h> 


fdefine  CLI_PATH "/var/tmp/" 
fdefine CLI PERM S_IRWXU /* rwx for user only */ 
/* 


* Create a client endpoint and connect to a server, 
* Returns fd if all OK, <0 on error. 
"| 
int 
cli_conn(const char *name) 
| 
int fd, len, err, rval; 
struct sockaddr un un, sun; 
int do unlink = 0; 


if (strlen(name) >= sizeof(un.sun_path)) { 
errno = ENAMETOOLONG; 
return (-1); 


/* create a UNIX domain stream socket */ 
if ((fd = socket (AF UNIX, SOCK STREAM, 0)) < 0) 
return (-1); 


/* fill socket address structure with our address */ 

memset (&un, 0, sizeof (un)); 

un.sun_family = AF_UNIX; 

sprintf(un.sun_path, "%Ss%05ld", CLI_PATH, (long) getpid()); 

len = offsetof (struct sockaddr_un, sun path) + strlen(un.sun_path) ; 


unlink (un.sun_path) ; /* in case it already exists */ 
if (bind(fd, (struct sockaddr *)&un, len) < 0) { 
rval = -2; 


goto errout; 
} 
if (chmod(un.sun_path, CLI_PERM) < 0) { 
rval = -3; 
do_unlink = 1; 
goto errout; 


/* fill socket address structure with server's address */ 
memset (&sun, 0, sizeof(sun)); 
sun.sun_family = AF_UNIX; 
strcpy(sun.sun_path, name); 
len = offsetof (struct sockaddr_un, sun path) + strlen (name); 
if (connect (fd, (struct sockaddr *)&sun, len) < 0) { 
rval = -4; 
do_unlink = 1; 
goto errout; 
} 


return (fd); 


errout: 
err = errno; 
close (fd); 
if (do_unlink) 
unlink(un.sun_path) ; 
errno = err; 
return (rval); 


图 17-10 cli conn 函 数 

调用 socket 函数 创建 UNIX 域 套 接 字 的 客户 进程 端 ， 然 后 用 客户 进 
程 专 有 的 名 字 填 入 sockaddr_un 结 构 。 

此 例 中 没 让 系统 选择 默认 地 址 ， 其 原因 是 ， 如 果 这 样 处 理 ， 服 务 右 
进程 将 不 能 区 分 各 个 客户 进程 (如 果 不 为 UNIX 域 套 接 字 显 式 地 绑 定 名 
字 ， 内 核 会 代表 我 们 隐 式 地 绑 定 一 个 地 址 且 不 会 在 文件 系统 创建 文件 来 
表示 这 个 套 接 字 ) 。 于 是 ， 我 们 绑 定 自己 的 地 址 ， 但 在 开发 使 用 套 接 字 
的 客户 端 程序 时 通常 并 不 采用 这 一 步 又 。 

绑 定 的 路 径 名 的 最 后 5 个 字符 来 上 自 客 户 进程 ID。 仅 在 该 路 径 名 已 存 
在 时 调用 unlink。 然 后 ， 调 用 bind 将 名 字 赋 给 客户 进程 套 接 字 。 这 在 文 
件 系统 中 创建 了 一 个 套 接 字 文 件 ， 所 用 的 名 字 与 被 绑 定 的 路 径 名 一 样 。 
接着 ， 调 用 chmod “关闭 除 用 户 读 、 有 用户 写 以 及 用 户 执行 以 外 的 其 他 权 
限 。 在 serv_accept 中 ， 服 务 器 进程 检验 这 些 权限 以 及 套 接 字 用 户 ID 以 验 
证 客户 进程 的 身份 。 

然后 ， 必 须 填充 另 一 个 sockaddr_ un 结构 ， 这 次 用 的 是 服务 进程 众 所 
周知 的 路 径 名 。 最 后 ， 调 用 connect 函 数 初始 化 与 服务 进程 的 连接 。 

















17.4 传送 》 HIN IT 


在 两 个 进程 之 间 传 送 打开 文件 描述 符 的 技术 是 非常 有 用 的 。 因 此 可 
以 对 客户 进程 -服务 器 进程 应 用 进行 不 同 的 设计 。 它 使 一 个 进程 〈 通 党 
古 服 务 器 进程 ) 能够 处 理 打开 一 个 文件 所 要 做 的 一 切 操 作 (包括 将 网 络 
名 翻译 为 网 络 地 址 、 拨 号 调制 解 调 器 、 协 商 文件 锁 等 ) 以 及 回调 用 进程 
送 回 一 个 描述 符 ， 访 描述 符 可 被 用 于 以 后 的 所 有 IO 函数 。 涉 及 打开 文 
件 或 设备 的 所 有 细 市 对 客户 进程 而 言 都 是 透明 的 。 

下 面 进一步 说 明 从 一 个 进程 同 故 一 个 进程 “传送 一 个 打开 文件 摘 述 
符 ” 的 含义 。 回 忆 图 3-8， 其 中 显示 了 两 个 进程 ， 它 们 打开 了 同一 文件 。 
虽然 它们 共享 同一 个 节点， 但 每 个 进程 都 有 它 目 己 的 文件 表 项 。 

当 一 个 进程 癌 另 一 个 进程 传送 一 个 打开 文件 描述 符 时 ， 我 们 想 让 发 
送 进程 和 接收 进程 共享 同一 文件 表 项 。 图 17-11 显 示 了 所 期 望 的 安排 。 








进程 表 项 





ie aeni 


义 件 表 








see INI 





图 17-11 从 顶部 进程 传送 一 个 打开 文件 至 底部 进程 
在 技术 上 上， 我们 是 将 指 癌 一 个 打开 文件 表 项 的 指针 从 一 个 进程 发 送 


到 另外 一 个 进程 。 该 指针 被 分 配 存放 在 接收 进程 的 第 一 个 可 用 描述 符 项 
中 。 注意， 不 要 造成 错觉 ， 以 为 发 送 进 程 和 接收 进程 中 的 描述 符 编 号 
是 相同 的 ， 它 们 通常 是 不 同 的 。) 两 个 进程 共享 同一 个 打开 文件 表 ， 这 
与 fork 之 后 的 父 进程 和 子 进程 共享 打开 文件 表 的 情况 完全 相同 〈 见 图 8- 
2) 。 

当 发 送 进程 将 描述 符 传 送 给 接收 进程 后 ， 通 名 会 关闭 该 摘 述 符 。 发 
送 进程 关闭 该 描述 符 并 不 会 真 的 关闭 该 文件 或 设备 ， 其 原因 是 该 描述 符 
仍 被 视 为 由 接收 进程 打开 《即使 接收 进程 尚未 接收 到 该 描述 符 ) 。 

下 面 定 义 本 章 用 以 发 送 和 接收 文件 摘 述 符 的 3 个 函数 。 本 节 后 面 会 
给 出 这 3 个 函数 的 代码 。 

#include "apue.h" 

int send_fd(int fd, int fd_to_send); 

int send_err(int fd, int status, const char *errmsg); 

两 个 函数 的 返回 值 : AI, Eo A, el- 
int recv_fd(int fd, ssize_t (*userfunc)(int, const void *, size_t)); 
返回 值 : 知 成 功 ， 返 回 文 件 描述 符 ; 知 出 错 ， 返 回 负 值 

当 一 个 进程 〈 通 党 是 服务 器 进程 ) 想 将 一 个 描述 符 传 送 给 另 一 个 进 
程 时 ， 可 以 调用 send_fd 或 send_err。 等 待 接 收 描 述 符 的 进程 (客户 进 
程 ) 调用 recv_fd。 

send fd 使 用 fd 代表 的 ”UNIX 域 套 接 字 发 送 描述 符 fd_to_send。 
send_err 使 用 fd 发 送 errmsg 以 及 后 随 的 status 字 节 。status 的 值 应 在 -1 
人 -255。 

客户 进程 调用 recv_fd 接收 摘 述 符 。 如 果 一 切 正 常 〈 发 送 者 调用 了 
send_fd) ， 则 函数 返回 值 为 非 负 摘 述 符 。 人 否则 ， 返 回 值 是 由 send_err 发 
送 的 status (-1~-255 的 一 个 负 值 ) 。 另 外 ， 如 果 服 务 器 进程 发 送 了 一 条 
出 错 消 息 ， 则 客户 进程 调用 它 自己 的 userfunc 函数 处 理 该 消息 。userfunc 
的 第 一 个 参数 是 常量 STDERR_FILENO， 然 后 是 指向 出 错 消息 的 指针 及 
其 长 度 。userfunc 函 数 的 返回 值 是 已 写 的 字 节 数 或 负 的 出 错 编写 值 。 客 
户 进 程 常 将 普通 的 write 函 数 指定 为 userfunc。 

我 们 实现 用 于 这 3 个 函数 的 我 们 目 己 制定 的 协议 。 为 发 送 一 个 描述 
符 ，send_fd 先 发送 2 字 节 0， 然 后 是 实际 描述 符 。 为 了 发 送 一 条 出 错 消 
息 ，send_err 发 送 errmsg， 然 后 是 1 字 节 0， 最 后 是 status 字 节 的 绝对 值 (1 
~255) 。recvy_fd 函 数 读 取 套 接 字 中 所 有 字 节 直至 遇 到 null 字 符 。null 字 
符 之 前 的 所 有 字符 都 传送 给 调用 者 的 userfunc。recv_fd 读 取 的 下 一 个 字 
节 是 状态 (status) 字 节 。 香 状态 字 节 为 0， 则 表示 一 个 描述 符 已 传送 过 
来 ， 否 则 表示 没有 摘 述 符 可 接收 。 

send_err 函 数 在 将 出 错 消 息 写 到 套 接 字 后 ， 即 调用 send_fq 函 数 ， 如 

















图 17-12 所 示 。 


tinclude "apue.h" 


/* 

* Used when we had planned to send an fd using send_fd(), 

* but encountered an error instead, We send the error back 
* using the send_fd()/recv_fd() protocol. 

i 

int 

send err (int fd, int errcode, const char *msg) 


| 
int ni 
if ((n = strlen(msg)) > 0) 
if (writen(fd, msg, n) != n)  /* send the error message */ 


return(-1); 


if (errcode >= 0) 
errcode = -1; /* must be negative */ 


if (send fd(fd, errcode) < 0) 


return(-1) ; 


return (0); 


图 17-12 send_err 函 数 








为 了 用 UNIX 域 套 接 字 交换 文件 摘 述 符 ， 调 用 sendmsg(2) 和 
recvmsg(2) 函 数 〈 见 16.5 节 ) 。 这 两 个 函数 的 参数 中 都 有 一 个 指 问 
msghdr 结 构 的 指针 ， 访 结构 包含 了 所 有 关于 要 发 送 或 要 接收 的 消息 的 信 
轧 。 该 结构 的 定义 大 致 如 下 : 


struct msghdr { 


void *msg_name; /* optional address 
*/ 

socklen_t msg_namelen; /* address size in bytes 
g 

struct iovec *msg_iov; /* array of I/O buffers */ 

int msg_iovlen; /* number of elements 
in array */ 

void *msg_control; /* ancillary data */ 

socklen_t msg_controllen; /* number of ancillary 
bytes */ 

int msg_flags; /* flags for received 
message */ 


} 

前 两 个 元 素 通 常用 于 在 网 络 连 接 上 故 送 数据 报 ， 其 中 日 的 地 址 可 以 
由 每 个 数据 报 指定 。 接 下 来 的 两 个 元 素 使 我 们 可 以 指定 一 个 由 多 个 绥 冲 
区 构成 的 数组 (散布 读 和 聚集 写 ) ， 这 与 对 readv 和 writev 函 数 〈( 见 14.6 
节 ) 的 说 明 一 样 。 msg_flags 字 上 段 包含 了 描述 接收 到 的 消 恩 的 标志 ， 
16-15 总 结 了 这 些 标志 。 

两 个 元 素 处 理 控制 信息 的 传送 和 接收 。msg_control 字 段 指 回 
cmsghdr 〈 控 制 信 息 头 ) 结构 ，msg_controllen 字 段 包含 控制 信息 的 字 节 
数 。 








struct cmsghdr { 


socklen_t cmsg_len; /* data byte count, including header 
oe 

int cmsg_level; /* originating protocol */ 

int cmsg_type; /* protocol-specific type */ 


/* followed by the actual control message data */ 


hi 

为 了 发 送 文件 描述 符 ， 将 cmsg_len 设 置 为 cmsghdr 结 构 的 长 度 加 一 
个 整 型 的 长 度 〈 摘 述 符 的 长 度 ) ，cmg_level 字 段 设 置 为 
SOL_SOCKET, cmsg type 字段 设 置 为 SCM_RIGHTS， 用 以 表明 在 传送 
访问 权 。 (SCM 是 Socket-level Control Message 的 缩写 ， 即 套 接 字 级 控制 


消息 。) 访问 权 仅 能 通过 UNIX 域 套 接 字 传 送 。 描 述 符 紧 随 cmsg_type 字 
段 之 后 存储 ， 用 CMSG_DATA 宏 获得 该 整 型 量 的 指针 。 
在 此 定义 3 个 宏 ， 用 于 访问 控制 数据 ， 一 个 宏 用 于 帮助 计算 
cmsg_len 所 使 用 的 值 。 
#include <sys/socket.h> 
unsigned char *CMSG_DATA(struct cmsghdr *cp); 
返回 值 : 返回 一 个 指针 ， 指 向 与 cmsghdr 结 构 相 关联 的 数据 
struct cmsghdr *CMSG Dee msghdr *mp); 
返回 值 ， 返 回 一 个 指针 ， 指 向 与 msghdr 结 构 相 关联 的 第 一 个 cmsghdr 结 


构 ; 
各 无 这 样 的 结构 ， 返 回 NULL 
struct cmsghdr *CMSG_NXTHDR(struct msghdr *mp, 
struct cmsghdr *cp); 
返回 值 : 返回 一 个 指针 ， 指 同 与 nsghdr 结 构 相 关联 的 下 一 1 Sue vena 
构 ， 该 msghdr 结 构 给 出 了 当前 的 cmsghdr 结 构 ， 若 当前 cmsghdr 结 构 已 是 
最 后 一 个 ， 返 回 NULL 
unsigned int CMSG_LEN(unsigned int nbytes); 
返回 值 : 返回 为 nbytes 长 的 数据 对 象 分 配 的 长 度 
Single UNIX Specification 定 义 了 前 3 个 宏 ， 但 没有 定义 
CMSG LEN 。 
CMSG_LEN 宏 返回 存储 nbytes 长 的 数据 对 象 押 需 的 字 节 数 ， 它 移 将 
吉 构 的 长 度 ， 然 后 按 处 理 器 体系 结构 的 对 齐 要 求 进行 
用 整 ， 最 后 再 向 上 取 整 。 
图 17-13 中 的 程序 是 UNIX 域 套 接 字 的 send_fd 函 数 ， 它 通过 UNIX 域 
套 接 字 传递 文件 描述 符 。sendmsg 调 用 被 用 来 传送 协议 数据 (包括 null 字 
“SAR ASE) 以 及 描述 符 





#include "apue.h" 
#include <sys/socket.h> 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG LEN (sizeof (int)) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd<0, then -fd is sent back instead as the error status. 
LF 
int 
send fd(int fd, int fd to send) 
{ 
struct iovec iov[1]; 
struct msghdr msg; 


char buf [2]; /* send_fd()/recv_fd() 2-byte protocol */ 
iov[0] .iov base = buf; 

iov[0] ,iov_ len = 2; 

msg.msg_iov = lov; 

msg.msg_iovlen = 1; 

msg .msg_name = NULL; 

msg.msg_namelen = 0; 


if (fd to send < 0) { 
msg.msg_control = NULL; 
msg.msg_controllen = 0; 


buf[1] = -fd_to_send; /* nonzero status means error */ 


if (buf[1] == 0) 


buf[1] = 1; /* -256, etc. would screw up protocol */ 


} else { 


if (cmptr == NULL && (cmptr = malloc (CONTROLLEN)) == NULL) 


return (-1); 
cmptr->cmsg_level = SOL_SOCKET; 
cmptr->cmsg_type = SCM RIGHTS; 
cmptr->cmsg_len = CONTROLLEN; 
msg.msg_control = cmptr; 
msg.msg_controllen = CONTROLLEN; 


* (int *)CMSG DATA(cmptr) = fd_to_send; /* the fd to pass 


#/ 


buf[l] = 0; /* zero status means OK */ 


buf[0] = 0; /* null byte flag to recv_fd() */ 
1f (sendmsg(fd, &msg, 0) != 2) 

return (-1); 
return (0); 





o a 
为 了 接收 一 个 文件 描述 符 《〈 见 图 17-14) ， 我 们 为 cmsghdr 结 构 和 描 
述 符 分 配 了 足够 大 的 空间 ， | 问 该 分 配 到 的 存储 区 ， 然 
后 调用 了 recvmsg。 使 用 CMSG_LEN 宏 计算 所 需 的 空间 总 量 。 
读 取 UNIX 域 套 接 字 ， 直 至 读 到 null 字 节 ， 它 位 于 最 后 的 状态 字 节 之 
前 。null 字 市 之 前 是 一 条 来 自发 送 者 的 出 错 消息 。 




















#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG LEN (sizeof (int) ) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 

* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR_FILENO, buf, nbytes). 

* We have a 2-byte protocol for receiving the fd from send_fd(). 
K 

int 

recv_fd(int fd, ssize_t (*userfunc) (int, const void *, size_t)) 


{ 


int newfd, nr, status; 
char *ptr; 

char buf [MAXLINE] ; 
struct iovec ov [1]; 


struct msghdr msg; 


status = -1; 
foe (rwa 
iov[0] ,iov base 


buf; 
sizeof (buf); 


iov[0] ,iov_ len 


msg.msg_iov = lov; 

msg.msg_iovlen = 1; 

msg.msg_name = NULL; 

msg.msg namelen = 0; 

if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return (-1); 

msg.msg_control = cmptr; 

msg.msg_controllen = CONTROLLEN; 


if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err ret ("recvmsg error"); 
return (-1); 

} else if (nr == 0) { 


err_ret("connection closed by server"); 
return (-1); 


/* 
* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
a 
for (ptr = buf; ptr < &buf[nr]; ) { 
if (*ptrtt+ == 0) { 
if (ptr != &buf[nr-1]) 
err_dump("message format error"); 
status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen < CONTROLLEN) 
err dump ("status = 0 but no fd"); 
newfd = *(int *)CMSG_DATA(cmptr) ; 
} else { 
newfd = -status; 


nr -= 2: 


} 

if (nr > 0 && (*userfunc) (STDERR FILENO, buf, nr) != nr) 
return (-1); 

if (status >= 0) /* final data has arrived */ 
return (newfd) ; /* descriptor, or -status */ 











图 17-14 通过 UNIX 域 套 接 字 接 收文 件 描述 符 

注意 ， 该 程序 总 是 准备 接收 一 个 摘 述 符 《〈 在 每 次 调用 recvmsg 之 
前 ， 设 置 msg_control 和 msg_controllen) ， 但 是 仅 当 msg_controllen 返 回 
的 是 非 0 值 时 ， 才 确实 接收 到 描述 符 。 

回忆 serv_accept 函 数 〈 见 图 17-9) 确定 调用 者 身份 的 步骤 。 如 果 内 
核能 够 把 调用 者 的 证 书 在 调用 accept 之 后 返回 给 调用 处 会 更 好 。 某 些 
UNIX 域 套 接 字 的 实现 提供 类 似 的 功能 ， 但 它们 的 接口 不 同 。 

FreeBSD 8.0 和 Linux 3.2.0 都 支持 通过 UNIX 域 套 接 字 发 送 证 书 ， 但 
它们 的 实现 方式 不 同 。Mac OS X 10.6.8 是 部 分 从 FreeBSD 派 生出 来 的 ， 
但 禁止 传送 证 书 。Solaris ”10 不 支持 通过 UNIX 域 套 接 字 传送 证 书 ， 然 而 
它 文 持 从 一 个 通过 STREAMS 管 道 传输 文件 擅 述 符 的 进程 中 获得 证 书 ， 
这 里 我 们 不 讨论 它 的 细 市 。 

在 FreeBSD 中 ， 将 证 书 作为 cmsgcred 结 构 传送 。 

#define CMGROUP_MAX 16 

struct cmsgcred { 

















pid_t cmcred_pid; /* sender's process ID */ 
uid_t cmcred_uid; /* sender's real UID */ 
uid_t cmcred_euid; /* sender's effective UID 
*/ 
gid_t cmcred_gid; /* sender's real GID */ 
short cmcred_ngroups; /* number of groups */ 
gid_t cmcred_groups[| CMGROUP_MAX]; /* groups */ 
T 


在 传送 证 书 时 ， 仅 需 为 cmsgcred 结 构 保 留存 储 空间 。 内 核 将 填充 该 
结构 以 防止 应 用 程序 伪装 成 具有 另 一 种 身份 。 
在 Linux 中 ， 将 证 书 作为 ucred 结 构 传 送 。 
struct ucred { 
pid_t pid; /* sender's process ID */ 
uid_t uid; /* sender's user ID */* sender's group ID */ 
gid_t gid; 
ie 
与 FreeBSD 不 同 ，Linux 需 要 在 传输 前 初始 化 这 个 结构 。 内 核 会 确保 
en 能 够 使 用 对 应 调用 者 的 值 ， 要 么 有 使 用 其 他 值 的 合适 权 
限 。 
图 17-15 显 示 了 更 新 过 后 的 send_fd 函 数 ， 它 包含 了 发 送 进程 的 证 


#include "apue.h" 
#include <sys/socket.h> 


#if defined (SCM CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define SCM CREDTYPE SCM_CREDS 

#elif defined (SCM CREDENTIALS) /* Linux interface */ 
#define CREDSTRUCT ucred 

#define SCM CREDTYPE SCM_CREDENTIALS 

#else 


#error passing credentials is unsupported! 
fendif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG_LEN (sizeof (int) ) 

#define CREDSLEN CMSG_LEN (sizeof (struct CREDSTRUCT) ) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr *omptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd<0, then -fd is sent back instead as the error status. 
如 
int 
send fd(int fd, int fd to send) 
{ 
struct CREDSTRUCT *credp; 


struct cmsghdr *cmp; 

struct iovec iov[1]; 

struct msghdr msg; 

char buf [2]; /* send_fd/recv_ufd 2-byte protocol */ 


ll 
ion 
= 
Fh 


iov[0] ,iov_ base 
iov[0] ,iov len = 2; 
msg.msg_iov = lov; 


I 
= 
se 


msg.msg_iovlen 


msg.msg_ name = NULL; 
msg.msg_namelen = 0; 
msg.msg_ flags = 0; 
if (fd_to_send < 0) { 
msg.msg_control = NULL; 
msg.msg_controllen = 0; 
buf[1] = -fd to send; /* nonzero status means error */ 


if (buf[1] == 0) 

buf[1] = 1; /* -256, etc. would screw up protocol */ 
} else { 

if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return (-1); 

msg.msg_control = cmptr; 

msg.msg_controllen = CONTROLLEN; 

cmp = cmptr; 


cmp->cmsg_level = SOL_SOCKET; 

cmp->cmsg_type = SCM RIGHTS; 

cmp->cmsg_len = RIGHTSLEN; 

*(int *)CMSG DATA (cmp) = fd_to_send; /* the fd to pass */ 

cmp = CMSG NXTHDR(&msg, cmp); 

cmp->cmsg_level = SOL SOCKET; 

cmp->cmsg_type = SCM CREDTYPE; 

cmp->cmsg_len = CREDSLEN; 

credp = (struct CREDSTRUCT *)CMSG DATA (cmp); 
#if defined (SCM CREDENTIALS) 

credp->uid = geteuid(); 

credp->gid = getegid(); 

credp->pid = getpid(); 


#endif 
buf[1] = 0; /* zero status means OK */ 
} 
buf [0] = 0; /* null byte flag to recv_ufd() */ 
if (sendmsg(fd, &msg, 0) != 2) 
return (-1); 


return (0); 


图 17-15 通过 UNIX 域 套 接 字 发 送 证 书 
注意 ， 只 有 在 Linux 上 才 需 要 初始 化 证 书 结构 。 
图 17-16 中 的 recv_ufd 函 数 是 recv_fd 的 修改 版 ， 它 通过 一 个 引用 参数 





返回 发 送 者 的 用 户 ID。 


#include "apue ,hn 
finclude <sys/socket.h> /* struct msghdr */ 
finclude <sys/un.h> 


#if defined (SCM CREDS) /* BSD interface */ 


define CREDSTRUCT cmsgcred 
#define CR UID cmered uld 
#define SCM CREDTYPE SCM_CREDS 


felif defined (SCM CREDENTIALS) 
define CREDSTRUCT 
define CR UID 
#define CREDOPT 
fdefine SCM CREDTYPE 
#else 


/* Linux interface */ 
ucred 

uid 

90 PASSCRED 

SCM CREDENTIALS 








#error passing credentials is unsupported! 
#endif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG LEN (sizeof (int) ) 

#define CREDSLEN CMSG_LEN (sizeof (struct CREDSTRUCT) ) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR_FILENO, buf, nbytes). 
* We have a 2-byte protocol for receiving the fd from send_fd(). 
mi 
int 
recv_ufd(int fd, uid_t *uidptr, 
ssize t (*userfunc) (int, const void *, size 七) ) 


struct cmsghdr *comp; 

struct CREDSTRUCT *eredp; 

char Ppt 

char buf [MAXLINE] ; 

struct iovec iov[1]; 

struct msghdr msg; 

int mrs 

int newfd = -1; 

int status = -1; 
#if defined (CREDOPT) 

const int on = 1; 


if (setsockopt (fd, SOL_SOCKET, CREDOPT, &o0n, sizeof(int)) < 0) { 
err_ret("setsockopt error"); 
return (-1); 
} 
#endif 
for ( ¢ wD) ft 
iov[0].iov_base = buf; 


iov[0].iov_len = sizeof (buf); 

msg.msg_iov = iov; 

msg.msg_iovlen = 1; 

msg.msg_name = NULL; 

msg.msg_namelen = 0; 

if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 


return (-1); 
msg.msg_control = cmptr; 
msg.msg_controllen = CONTROLLEN; 
if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err_ret("recvmsg error"); 
return (-1); 
} else if (nr == 0) { 
err ret ("connection closed by server"); 
return (-1); 


* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
of 
for (ptr = buf; ptr < &buf[nr]; ) { 
if (*ptr++ == 0) { 
if (ptr != &buf[nr-1]) 
err dump("message format error"); 
status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen != CONTROLLEN) 
err dump("status = 0 but no fd"); 


/* process the control data */ 
for (cmp = CMSG_FIRSTHDR(&msg) ; 
cmp != NULL; cmp = CMSG_NXTHDR(&msg, cmp)) { 
if (cmp->cmsg_level != SOL_SOCKET) 
continue; 
switch (cmp->cmsg_type) { 
case SCM RIGHTS: 
newfd = *(int *)CMSG_DATA(cmp) ; 
break; 
case SCM CREDTYPE: 
credp = (struct CREDSTRUCT *)CMSG_DATA (cmp) ; 
*uidptr = credp->CR_UID; 


} 
} else { 

newfd = -status; 
} 


nr -= 2; 


} 
if (nr > 0 && (*userfunc) (STDERR FILENO, buf, nr) != nr) 


return (-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd) ; /* descriptor, or -status */ 


图 17-16 通过 UNIX 域 套 接 字 接收 证 书 
在 FreeBSD 中 ， 指 定 SCM_CREDS 表 示 要 传送 证 书 。 在 Linux 中 ， 则 
使 用 SCM_CREDENTIALS。 
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使 用 文件 描述 符 传送 技术 开发 一 个 open 服务 器 进程 一 一 个 由 一 个 
进程 执行 以 打开 一 个 或 多 个 文件 。 该 服务 器 进程 不 是 将 文件 内 容 送 回调 
用 进程 ， 而 是 送 回 一 个 打开 文件 描述 符 。 这 使 该 服务 器 进程 对 任何 类 型 
的 文件 〈 如 设备 或 套 接 字 ) 而 不 单 是 普通 文件 都 能 起 作用 。 客 户 进 程 和 
服务 器 进程 用 IPC 交 换 最 小 量 的 信息 : 从 客户 进程 到 服务 器 进程 传送 文 
件 名 和 打开 模式 ， 而 从 服务 器 进程 到 客户 进程 返回 摘 述 符 。 文 件 内 容 不 
需 通 过 IPC 交 换 。 

将 服务 器 进程 设计 成 一 个 单独 的 可 执行 程序 (或 者 是 由 客户 进程 执 
行 的 ， 这 正 是 本 节 上 所 说 明 的 ;或 者 是 由 守护 服务 器 进程 执行 的 ， 将 在 下 
一 节 进 行 说 明 ) 有 很 多 优点 。 

“任何 客户 进程 都 能 很 容易 地 和 服务 器 进程 联系 ， 这 类 似 于 客户 进 
程 调用 一 个 库 函 数 。 我 们 没有 将 特定 服务 人 硬 编 码 在 应 用 程序 中 ， 而 是 设 
计 了 一 种 可 供 重 用 的 设施 。 

“如 知 需 要 更 改 服务 器 进程 ， 那 么 也 只 影响 一 个 程序 。 相 反 ， 更 新 
一 个 库 函 数 可 能 需要 更 新 调用 此 库 函 数 的 所 有 程序 〈 即 用 连接 编辑 器 重 
新 连接 ) 。 共 享 库 函 数 可 以 简化 这 种 更 新 〈 见 7.7 节 ) 。 

“服务 器 进程 可 以 是 一 个 设置 用 户 ID 程序 ， 于 是 使 其 具有 客户 进程 
没有 的 附加 权限 。 注 意 ， 库 函数 〈 或 共享 库 函 数 ) 不 能 提供 这 种 能 力 。 
客户 进程 创建 一 个 fd 管道 ， 然 后 调用 fork 和 exec 来 调用 服务 器 进 
程 。 客 户 进程 使 用 一 端 经 fd 管道 发 送 请 求 ， 服 务 器 进程 使 用 另 一 端 经 fd 

管道 回 送 啊 应 。 

定义 客户 进程 和 服务 器 进程 间 的 应 用 程序 协议 如 下 。 

(1) 客户 进程 通过 fd 管道 向 服务 器 进程 发 送 “open <pathname> 
<openmode>\0” 形 式 的 请 求 。<openmode> 是 数值 ， 以 ASCII 十 进 制 数 表 
示 ， 是 open 函 数 的 第 二 个 参数 。 该 请 求 字符 串 以 null 字 符 终 止 。 

(2) 服务 器 进程 调用 send_fd 或 send_err 回 送 打开 描述 符 或 出 错 消 


这 是 一 个 进程 同 其 父 进程 发 送 打开 描述 符 的 实例 。17.6 节 将 修改 此 
实例 来 使 用 一 个 守护 服务 器 进程 ， 它 的 服务 器 进程 将 一 个 描述 符 发 送 给 
一 个 完全 无 天 的 进程 。 

首先 要 有 一 个 头 文件 open.h《〈 见 图 17-17) ， 它 包括 标准 头 文件 ， 并 
且 定 义 了 函数 原型 。 
































finclude "apue.h" 
#include <errno.h> 


define CL OPEN "open" /* client's request for server */ 


int csopen(char *, int); 


图 17-17 open.h 头 文件 
main 函 数 〈 见 图 17-18) 是 一 个 循环 ， 它 先 从 标准 输入 读 一 个 路 径 
名 ， 然 后 将 该 文件 复制 到 标准 输出 。 它 调用 csopen 函 数 来 联系 open 服 务 
器 进程 ， 从 其 返回 一 个 打开 描述 符 。 
include "open. h" 
include 《fcnt1,h> 


#define BUFFSIZE 8192 


int 
main(int argc, char *argv[]) 
| 
int n, fd; 
char buf [BUFFSIZE]; 
char line (MAXLINE] ; 


/* read filename to cat from stdin */ 
while (fgets(line, MAXLINE, stdin) != NULL) { 
if (line(strlen(line) - 1] == '\n') 
line[strlen(line) - 1] = 0; /* replace newline with null */ 


/* open the file */ 
if ((fd = csopen(line, O_RDONLY)) < 0) 
continue;  /* csopen() prints error from server */ 


/* and cat to stdout */ 
while ((n = read(fd, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) != n) 
err_sys("write error"); 
if (n < 0) 
err sys("read error"); 
close (fd); 


exit(0); 


图 17-18 main 函数 
函数 csopen《 见 图 17-19〉 在 创建 了 fd 管道 之 后 ， 进 行 了 服务 器 进程 
的 fork 和 exec 操 作 。 


#include "open.h" 
#include <sys/uio.h> /* struct iovec */ 


/* 

* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
mf 

int 

csopen (char *name, int oflag) 


{ 


pid_t pid; 
int len; 
char buf [10]; 


struct iovec iov[3]; 
static int fd(2] = { -1, -1 }; 


if (fd[0] < 0) { /* fork/exec our open server first time */ 
if (fd pipe(fd) < 0) { 
err ret ("fd pipe error"); 
return(-1); 
} 
if ((pid = fork()) < 0) { 
err ret ("fork error"); 
return(-1); 
} else if (pid == 0) { /* child */ 
close (fd[0]); 
if (fd[1] != STDIN FILENO && 
dup2 (fd[1], STDIN FILENO) != STDIN FILENO) 
err_sys("dup2 error to stdin"); 
if (fd[1] != STDOUT_FILENO && 
dup2 (fd[1], STDOUT_FILENO) != STDOUT_FILENO) 
err sys("dup2 error to stdout"); 
if (execl("./opend", "opend", (char *)0) < 0) 
err_sys("execl error"); 
} 
close (fd[1]); /* parent */ 


} 

sprintf (buf, " $d", oflag); /* oflag to ascii */ 

[0] ,iov base = CL OPEN " "; /* string concatenation */ 
,10V Jen = strlen(CL OPEN) + 1; 


lov(0] 
iov[0] 


10V[]] ,lov base = name; 





] ,10V base = buf; 
„iov len = strlen(buf) + 1; /* +1 for null at end of buf */ 
len = iov({0].iov_len + iov[1].iov_len + iov[2].iov_len; 
if (writev(fd[0], &iov[0], 3) != len) | 
err ret ("writev error"); 


10V 








0 
0 
[1 
lov(1].iov_len = strlen(name) ; 
[2 
[2 


10V 


return (-1); 


/* read descriptor, returned errors handled by write() */ 
return (recv fd(fd[{0], write)); 


图 17-19 csopenek 2 

子 进程 关闭 fd 管道 的 一 端 ， 父 进程 天 闭 男 一 端 。 作 为 服务 器 进程 ， 
子 进程 也 将 fd 管道 的 一 端 复制 到 其 标准 输入 和 标准 输出 。( 男 一 种 可 选 
gees 将 描述 符 fd[I1] 的 ASCII 表 示 形 式 作 为 一 个 参数 传送 给 服务 

和 进程。 ) 

父 进 程 将 包含 路 径 名 和 打开 模式 的 请 求 发 送 给 服务 器 进程 。 最 后 ， 
父 进程 调用 recv_fq 返 回 摘 述 符 或 出 错 消 息 。 如 果 服 务 器 进程 返回 出 错 消 
上 息 ， 那 么 父 进程 调用 write， 回 标准 错误 输出 该 消息 。 

现在 ， 让 我 们 来 看 看 open 服 务 器 进程 。 其 程序 是 opend， 由 图 17-19 
中 的 子 进 程 执 行 。 首 先 ， 要 有 一 个 opend.h 头 文件 〈 见 图 17-20) ， 它 包 
括 标准 头 文件 ， 并 且 声 明了 全 局 变量 和 函数 原型 。 

















finclude "apue.h" 
#include <errno,h> 


tdefine CL OPEN "open" /* client's request for server */ 

extern char errmsg[]; /* error message string to return to client */ 
extern int  oflag; /* open() flag: O_xxx ... */ 

extern char *pathname; /* of file to open() for client */ 

int cli_args(int, char **); 


void handle request (char *, int, int); 
图 17-20 opend.h 头 文件 
main 函数 〈 见 图 17-21) 经 fd 管道 〈 它 的 标准 输入 ) 读 来 自 客 户 进 
程 的 请 求 ， 然 后 调用 函数 handle_request。 


finclude "opend,j 


Char errmsg [MAXLINE] ; 
int oflag; 
char  *pathname; 


int 
main (void) 


| 


int nread; 
char buf [MAXLINE]; 


for (; ; ) {/* read arg buffer from client, process request */ 
if ((nread = read(STDIN FILENO, buf, MAXLINE)) < 0) 
err sys("read error on stream pipe"); 
else if (nread == 0) 
break; /* client has closed the stream pipe */ 
handle request (buf, nread, STDOUT FILENO) ; 
} 
exit (0); 





图 17-21 服务 器 进程 main 函 数 第 1 版 
图 17-22 中 的 handle_request 函 数 承 担 了 全 部 工作 。 它 调用 函数 
buf _ args 将 客户 进程 请 求 分 解 成 标准 argv 型 的 参数 表 ， 然 后 调用 函数 
dli_args 处 理 客户 进程 的 参数 。 如 果 一 切 正常 ， 则 调用 open 打 开 相 应 文 
件 ， 接 着 调用 send_fd， 经 由 fd 管道 ( 它 的 标准 输出 〉 将 摘 述 符 回 送 给 客 
户 进程 。 如 果 出 错 则 调用 send_err 回 送 一 则 出 错 消 息 ， 其 中 使 用 了 前 面 
说 明 的 客户 进程 -服务 器 进程 协议 。 





finclude  "opend.h" 
#include <fentl,h> 


void 
handle request (char *buf, int nread, int fd) 


| 


int newfd; 


if (buf(nread-1] != 0) { 
snprintf (errmsg, MAXLINE-1, 
"request not null terminated: %*.*s\n", nread, nread, buf); 
send err (fd, -1, errmsg); 
return; 
} 
if (buf_args(buf, cli_args) < 0) { /* parse args & set options */ 
send err (fd, -1, errmsg); 
return; 
if ((newfd = open(pathname, oflag)) < 0) { 
snprintf (errmsg, MAXLINE-1, "can't open %s: %s\n", pathname, 
strerror (errno) ); 
send err (fd, -1, errmsg); 
return; 
| 
if (send fd(fd, newfd) < 0) /* send the descriptor */ 
err sys("send_fd error"); 
close(newfd);  /* we're done with descriptor */ 





图 17-22 handle_request 函 数 第 1 版 

客户 进程 请 求 是 一 个 以 null 终止 的 字符 串 ， 它 包含 由 空格 分 隔 的 参 
Bo Al 17-23 中 的 buf_args 函 数 将 字符 串 分 解 成 标准 argv 型 参数 表 ， 并 
调用 用 户 函 数 处 理 参数 。 我 们 使 用 ISO C 函 数 strtok 将 字符 串 分 割 成 独立 
的 参数 。 





#include "apue.h" 


#define MAXARGC 50 /* max number of arguments in buf */ 
#define WHITE " \t\n" /* white space for tokenizing arguments */ 


/* 
* buf[] contains white-space-separated arguments. We convert it to an 
* argv-style array of pointers, and call the user's function (optfunc) 
* to process the array. We return -1 if there's a problem parsing buf, 
* else we return whatever optfunc() returns. Note that user's buf[] 

* array is modified (nulls placed after each token). 
g 

int 

buf args (char *buf, int (*optfunc) (int, char **)) 

{ 

char *otr, *argv(MAXARGC] ; 
int argc; 


if (strtok(buf, WHITE) == NULL) /* an argv[0] is required */ 
return (-1); 

argv[argc = 0] = buf; 

while ((ptr = strtok(NULL, WHITE)) != NULL) { 
if (++argc >= MAXARGC-1) /* -1 for room for NULL at end */ 

return(-1); 

argv(argc] = ptr; 

} 

argv[ttargc] = NULL; 


/* 

* Since argv[] pointers point into the user's buf[], 
* user's function can just copy the pointers, even 
* though argv[] array will disappear on return. 

*/ 

return((*optfunc) (argc, argv)); 


图 17-23 buf_args 函 数 
buf_args 调 用 的 服务 器 进程 函数 是 cli_args〈 见 图 17-24) 。 它 验证 客 
人 
z > 量 


#include "opend ,hn 


/+* 
* This function is called by buf_args(), which 1s called by 


* handle request(). buf_args() has broken up the client's 
* buffer into an argv[]-style array, which we now process, 
iy 
int 
cli_args(int argc, char **argv) 
| 

if (argc != 3 || stremp(argv[0], CL OPEN) != 0) { 


strcpy (errmsg, "usage: <pathname> <oflag>\n"); 
return (-1) ; 


pathname = argv(1]; 
oflag = atoi(argv(2]); 
return (0) ; 


/* save ptr to pathname to open */ 


图 17-24 cli_args pki 2 
这 样 也 就 完成 了 open 服 务 器 进程 ， 它 由 客户 进程 执行 fork 和 exec 来 
调用 。 在 fork 之 前 创建 了 一 个 fd 管道 ， 然 后 客户 进程 和 服务 器 进程 用 其 
进行 通信 。 在 这 种 安排 下 ， 每 个 客户 进程 都 有 一 个 服务 器 进程 。 
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在 上 一 节 中 ， 我 们 开发 了 一 个 open 服 务 占 进程 ， 由 客户 进程 执行 
fork 和 exec 调 用 ， 它 说 明了 如 何 从 子 程序 癌 父 程序 传送 文件 描述 符 。 本 
节 将 开发 一 个 守护 进程 方式 的 open 服务 器 进程 。 一 个 服务 器 进程 处 理 
所 有 客户 进程 的 请 求 。 由 于 避免 了 使 用 fork 和 exec， 我 们 期 望 这 个 设 
计 会 更 有 效 。 在 客户 进程 和 服务 器 进程 之 间 仍 使 用 UNIX 域 套 接 字 连 
接 ， 并 用 实例 说 明 在 两 个 无 关 进 程 乙 间 如 何 传送 文件 描述 符 。 我 们 将 使 
用 17.3 节 引 入 的 3 个 函数 : serv_listen、serv_accept 和 cli_conn。 这 个 服 
务 器 进程 还 将 演示 一 个 服务 器 进程 如 何 处 理 多 个 客户 进程 ， 为 此 要 用 到 
14.4 节 中 说 明 的 select 和 poll 函 数 。 

本 节 所 述 的 客户 进程 类 似 于 17.5 节 中 的 客户 进程 。 实 际 上 ， 文 件 
main.c 是 完全 相同 的 〈 见 图 17-18) 。 我 们 将 在 open.h 头 文件 〈 见 图 17- 
17) 中 加 入 下 面 这 行 : 

#define CS_OPEN "/tmp/opend.socket" /* server's well-known name */ 

因为 在 此 例 中 调用 的 是 cli_conn 而 非 fork 和 exec， 所 以 文件 open.c 与 
图 17-19 中 的 不 同 。 修 改 后 如 图 17-25 所 示 。 








finclude  "open.h" 
finclude <sys/uio,h> /* struct iovec */ 


/* 
* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back, 
int 
csopen(char *name, int oflag) 
| 

int len; 

char buf [12]; 

struct iovec iov(3]; 

static int csfd = -1; 


if (csfd < 0) {  /* open connection to conn server */ 
if ((csfd = cli_conn(CS_OPEN)) < 0) { 
err ret ("cli conn error"); 
return (-1); 


sprintf (buf, " %d", oflag); /* oflag to ascii */ 


] ,iov base = CL OPEN " "; /* string concatenation */ 


lov[0] ,iov len = strlen(CL OPEN) + 1; 


10v| 
iov[1].1ov base = name; 


lov[2] ,10V base = buf; 











0 
0 
[1 
iov[1].iov_len = strlen (name); 
[2 
iov[2] ,iov len = strlen(buf) + 1; /* null always sent */ 
len = iov[0].iov_len + iov[1] ,iov len + iov(2].iov_len; 
if (writev(csfd, &iov[0], 3) != len) { 
err ret ("writev error"); 
return(-1); 


/* read back descriptor; returned errors handled by write() */ 
return (recv fd(csfd, write)); 


图 17-25 csopen 函 数 第 2 版 
客户 进程 与 服务 器 进程 之 间 使 用 的 协议 仍然 相同 。 
接 下 来 再 看 服务 器 进程 。 头 文件 opend.h 〈 见 图 17-26) 包括 了 标准 
头 文件 ， 并 且 声 明了 全 局 变量 和 函数 原型 。 





tinclude "apue ,hn 
include <errno.h> 


#define CS OPEN "/tmp/opend.socket"  /* well-known name */ 
#define CL OPEN "open" /* client's request for server */ 


extern int debug; /* nonzero if interactive (not daemon) */ 
extern char errmsg[];  /* error message string to return to client */ 
extern int of lag; /* open flag: 0 XXX ... */ 





extern char *pathname; /* of file to open for client */ 


typedef struct { /* one Client struct per connected client */ 
int fd; /* fd, or -1 if available */ 
uid t uld; 
} Client; 
extern Client *client; /* ptr to malloc'ed array */ 
extern int client size; /* # entries in client[] array */ 
int cli_args(int, char **); 


int client add(int, uld t); 

void client del (int) ; 

void loop (void); 

void handle request (char *, int, int, uid t); 

图 17-26 opend.h 头 文件 第 2 版 
因为 此 服务 器 进程 处 理 所 有 客户 进程 ， 所 以 它 必 须 保 存 每 个 客户 进 

程 连接 的 状态 。 这 是 用 在 opend.h 头 文件 中 声明 的 client 数 组 实现 的 。 图 
17-27 定 义 了 3 个 处 理 此 数组 的 函数 。 











村 nclude  "opend.h" 


#define NALLOC 10 /* # client structs to alloc/realloc for */ 


static void 


client_alloc (void) /* alloc more entries in the client[] array */ 
{ 
int iy 
if (client == NULL) 
client = malloc(NALLOC * sizeof (Client)); 
else 
client = realloc(client, (client _size+NALLOC) *sizeof (Client) ); 
if (client == NULL) 


err_sys("can't alloc for client array"); 


/* initialize the new entries */ 
for (i = client_size; i < client size + NALLOC; i++) 
client[i].fd = -1; /* fd of -1 means entry available */ 


client_size += NALLOC; 


/* 
* Called by loop() when connection request from a new client arrives. 
x 

int 

client_add(int fd, uid_t uid) 

{ 


int i; 
if (client == NULL) /* first time we're called */ 
client_alloc(); 
again: 
for {i = Of i. < elientusizes i++) 4 
if (client[i].fd == -1) { /* find an available entry */ 
client[i].fd = fd; 
client[i].uid = uid; 


return(i);/* return index in client[] array */ 


7/* client array full, time to realloc for more KX 
client_alloc(); 


goto again; /* and search again (will work this time) */ 
} 
/* 
* Called by loop() when we're done with a client. 
*y 
void 


client_del (int fd) 
{ 


int is 
For G = OF 1 S$ llent sizez r++) + 
if (client[i].fd == fd) { 
client[i].fd = -1; 


return; 


log quit ("can't find client entry for fd %d", fd); 




















图 17-27 处 理 client 数 组 的 3 个 函数 

第 一 次 调用 client_add 时 ， 它 调用 client_alloc，client_alloc 又 调用 
malloc 为 该 数组 的 10 个 登记 项 分 配 空间 。 在 这 10 个 登记 项 全 部 用 完 后 ， 
如 车 再 调用 client_add， 那 么 client_alloc 函 数 将 调用 realloc 来 分 配 附 加 空 
间 。 依 靠 这 种 动态 空间 分 配 ， 我 们 无 需 在 编译 时 将 估计 的 数组 长 度 值 放 
入 头 文件 中 从 而 限制 dient 数 组 的 长 上 度 。 如 果 出 错 ， 这 些 函 数 将 调用 log_ 
PRL COBB) ， 因 为 我 们 假定 服务 堪 进 程 是 守护 进程 。 

通常 服务 器 进程 会 作为 守护 进程 运行 ， 但 我 们 想 提 供 一 个 让 其 前 台 
运行 的 选项 ， 同 时 能 够 把 分 析 信息 发 送 到 标准 错误 输出 。 这 应 该 能 使 服 
务 絮 更 容易 评测 和 调试 ， 特 别 是 当 用 户 没 有 权限 读 取 那 些 分 析 信 息 经 常 
写 入 的 日 志文 件 时 。 可 以 使 用 一 个 命令 行 选项 来 控制 服务 器 是 否 在 前 台 
运行 或 者 作为 守护 进程 在 后 台 运 行 。 

一 个 系统 的 所 有 命令 遵循 相同 的 约定 是 非常 重要 的 ， 因 为 这 会 提高 
它 的 易 用 性 。 如 果 有 人 熟悉 某 条 命令 的 选项 风格 ， 那 么 大 后 面 的 命令 使 
用 了 其 他 的 风格 ， 他 就 很 容易 犯错 。 

处 理 命 令 行 空 格 就 很 容易 发 生 这 样 的 问题 。 有 些 命令 需要 它 的 选项 
和 其 参数 以 空格 隔 开 ， 而 另 一 些 则 希望 它 的 参数 直接 跟 在 它 的 选项 之 
后 。 如 果 没 有 胆 循 一 个 一 致 的 规则 ， 用 户 惑 得 记 住所 有 命令 的 语法 ， 或 
者 在 尝试 和 调 错 中 调用 这 些 命令 。 

Single UNIX Specification 包 括 了 一 系列 的 约定 和 规范 来 保证 命令 行 
语法 的 一 致 性 ， 其 中 包括 一 些 建议 ， 如 “限制 每 个 命令 行 选项 为 一 个 单 
一 的 阿拉 伯 字 符 ?" 以 及 “所 有 选项 必须 以 一 ' 作 为 开头 字符 ”。 

焉 运 的 是 ，getopt 函 数 能 够 帮助 命令 开发 者 以 一 致 的 方式 处 理 命 令 
行 选项 。 

#include <unistd.h> 

int getopt(int argc, char * const argv[], const char *options); 

extern int optind, opterr, optopt; 

extern char *optarg; 

返回 值 : 大 所 有 选项 被 处 理 完 ， 返 回 -1; 和 否则， 返回 下 一 个 选项 字符 
参数 argc 和 argv 与 传 入 main 函 数 的 一 样 。options 参 数 是 一 个 包含 该 


























命令 支持 的 选项 字符 的 字符 串 。 如 果 一 个 选项 字符 后 面 接 了 一 个 冒号 ， 
则 表示 该 选项 需要 参数 ;人 否则， 该 选项 不 需要 额外 参数 。 举 例 来 说 ， 如 
果 一 条 命令 的 用 法 说 明 如 下 : 

command [-i] [-u username] [-z] filename 

则 我 们 可 以 给 getopt 传 送 一 个 "iu:z" 作 为 options 字 符 串 。 

函数 getopt 一 般 用 在 循环 体内 ， 循 环 直 到 getopt 返 回 -1 时 退出 。 每 次 
迭代 中 ，getopt 会 返回 下 一 个 选项 。 应 用 程序 负责 科 选 这 些 选项 ， 判 断 
是 否 有 冲突 ，getopt 仅 负 责 解 释 选 项 并 保证 一 个 标准 的 格式 。 

当 遇 到 无 效 的 选项 时 ，getopt 返 回 一 个 问题 标记 Cquestion mark) 而 
不 是 这 个 字符 。 如 果 选 项 缺少 参数 ，getopt 也 会 返回 一 个 问题 标记 ， 但 
如 果 选 项 字符 串 的 第 一 个 字符 是 冒号 ，getopt 会 直接 返回 冒号 。 而 特殊 
的 “--” 格 式 则 会 导致 getopt 停 止 处 理 选项 并 返回 -1。 这 人 允许 用 户 传递 
以 “-” 开 头 但 不 是 选项 的 参数 。 人 例如， 如果 有 一 个 名 字 为 “-bar 的 文件 ， 
下 面 的 命令 行 是 无 法 删除 这 个 文件 的 : 





rm —bar 
为 rm 会 试图 把 -bar 解 释 为 选项 。 正 确 的 删除 文件 的 命令 应 该 是 : 
rm -- -bar 


getopt 测 数 支 持 以 下 4 个 外 部 变量 。 

optarg 。 ”如果 一 个 选项 需要 参数 ， 在 处 理 该 选项 时 ，getopt 会 设置 
optarg 指 向 该 选项 的 参数 字符 串 。 

opterr 如 果 一 个 选项 发 生 了 错误 ，getopt 会 默认 打印 一 条 出 错 消息 。 
应 用 程序 可 以 通过 设置 opterr 参 数 为 0 来 禁止 这 个 行为 。 

optind 用 来 存放 下 一 个 要 处 理 的 字符 囊 在 argv 数 组 里 的 下 标 。 它 从 1 
开始 ， 每 处 理 一 个 参数 ，getopt 痢 会 对 其 递增 1。 

optopt 如 果 处 理 选项 时 发 生 了 错误 ，getopt 会 设置 optopt 指 向 导致 出 
错 的 选项 字符 串 。 

open 服 务 器 进程 的 main 函 数 〈 见 图 17-28〉 定 义 全 局 变量 ， 处 理 命 
令 行 选项 ， 并 且 调 用 loop 函 数 。 如 果 以 -d 选 项 调用 服务 占 进 程 ， 则 服务 
器 进程 将 以 交互 方式 运行 而 非 守护 进程 方式 。 测 试 服务 器 进程 时 会 用 到 
这 个 选项 。 





include "opend. h" 
include <syslog.h> 


int debug, oflag, client_size, log_to_stderr; 
char errmsg [MAXLINE] ; 

char *pathname; 

Client *client = NULL; 


int 
main(int argc, char *argv[]) 
{ 


int Gy 
log_open("open.serv", LOG PID, LOG_USER) ; 
opterr = 0; /* don't want getopt() writing to stderr */ 


while ((c = getopt(argc, argv, "d")) != EOF) { 
switch (c) { 


case 'd': /* debug */ 
debug = log_to_stderr = 1; 
break; 

case '?'; 


err quit ("unrecognized option: -%c", optopt); 


if (debug == 0) 
daemonize ("opend") ; 


loop(); /* never returns */ 





图 17-28 服务 器 进程 main 函 数 第 2 版 
loop 函 数 是 服务 器 进程 的 无 限 循环 。 我 们 将 给 出 该 函数 的 两 种 版 
本 。 ee ae 图 17-30 所 示 的 程序 是 使 用 poll 的 
Fh : 





#include "opend.h" 
#include <sys/select.h> 


void 
loop (void) 
{ 


int i, n, maxfd, maxi, listenfd, clifd, nread; 
char buf [MAXLINE]; 
uid t uid; 


fd set rset, allset; 
FD_ZERO (&allset); 


/* obtain fd to listen for client requests on */ 

if ((listenfd = serv_listen(CS_OPEN)) < 0) 
log_sys("serv_listen error"); 

FD_SET(listenfd, &allset); 

maxfd = listenfd; 

maxi = -1; 


EGE WW z) 4 
rset = allset; /* rset gets modified each time around */ 
if ((n = select(maxfd + 1, &rset, NULL, NULL, NULL)) < 0) 
log_sys("select error") ; 


if (FD_ISSET(listenfd, &rset)) { 

/* accept new client request */ 

if ((clifd = serv_accept(listenfd, &uid)) < 0) 
log_sys("serv_accept error: %d", clifd); 

i = client_add(clifd, uid); 

FD_SET(clifd, &allset); 

if (clifd > maxfd) 
maxfd = clifd; /* max fd for select() */ 

if (i > maxi) 


maxi = i; /* max index in client[] array */ 
log_msg("new connection: uid %d, fd %d", uid, clifd); 
continue; 
} 
for (i = 0; i <= maxi; i++) { /* go through client[] array */ 
if ((clifd = client[i].fd) < 0) 
continue; 


if (FD_ISSET(clifd, &rset)) { 
/* read argument buffer from client */ 
if ((nread = read(clifd, buf, MAXLINE)) < 0) { 
log_sys ("read error on fd %d", clifd); 
} else if (nread == 0) { 
log_msg("closed: uid %d, fd %d", 
和 Aad, CLL > 
client_del(clifd);/* client has closed cxn */ 
FD CLR(clifd, &allset); 
close (clifd) ; 


} else { /* process client's request */ 
handle request (buf, nread, clifd, client[i].uid); 




















图 17-29 使 用 select 的 loop 函 数 

此 函数 调用 serv_listen 〈 见 图 17-8) 创建 服务 器 进程 与 客户 进程 连接 
的 端点 。 此 函数 的 其 余部 分 是 一 个 循环 ， 它 从 selet ”调用 开始 。 在 
select 返回 后 ， 可 能 会 发 生 下 面 两 种 情况 。 

(1) 摘 述 符 listenfd 可 以 随时 读 取 ， 这 意味 着 一 个 新 客户 进程 已 调 
用 了 cli conn。 为 了 处 理 这 种 情况 ， 我 们 将 调用 serv_accept〈 见 图 17- 
9) ， 然 后 为 新 客户 进程 更 新 client 数 组 以 及 与 该 新 客户 进程 相关 的 得 记 
信息 。《 我 们 要 跟踪 select 的 第 一 个 参数 的 最 高 描述 符 编写， 还 要 跟踪 
使 用 中 的 client 数 组 的 最 高 下 标 。) 

(2) 一 个 现 有 的 客户 进程 的 连接 可 以 随时 读 取 。 这 意味 着 该 客户 
进程 已 经 终止 ， 或 者 该 客户 进程 已 发 送 一 个 新 请 求 。 如 果 read 返 回 
0 文件 结束 ) ， 则 表示 客户 进程 已 终止 。 如 果 read 返 回 的 值 大 于 0， 则 
表示 有 一 个 新 请 求 需 处 理 ， 可 以 调用 request 来 处 理 。 

用 allset 朱 述 符 集 跟 踩 当前 使 用 的 描述 符 。 当 新 客户 进程 连接 至 服务 
To ， 会 打开 此 描述 符 集 的 相应 位 。 当 该 客户 进程 终止 时 ， 会 关闭 
日 应 位 。 

因为 客户 进程 的 所 有 描述 符 都 由 内 核 自 动 关 闭 〈 包 括 与 服务 器 进程 
的 连接 ) ， 所 以 我 们 总 能 知道 什么 时 候 客户 进程 终止 了 ， 该 终止 是 否 是 
自愿 的 。 这 与 XSI IPC 机 制 不 同 。 

使 用 poll 函 数 的 loop 函 数 如 图 17-30 所 示 。 














include  "opend.h" 
tinclude <poll.h> 


tdefine NALLOC 10 /* ¢ pollfd structs to alloc/realloc */ 
static struct pollfd * 


grow pollfd (struct pollfd *pfd, int *maxfd) 
| 


int i; 
int oldmax = *maxfd; 
int newmax = oldmax + NALLOC; 


if ((pfd = realloc(pfd, newmax * sizeof (struct pollfd))) == NULL) 
err sys("realloc error"); 
for (i = oldmax; i < newmax; itt) { 
pfd{i].fd = -1; 
pfd[i].events = POLLIN; 
pfd[i].revents = 0; 
*maxfd = newmax; 
return (pfd) ; 


void 
loop (void) 


int i, listenfd, clifd, nread; 


char buf [MAXLINE] ; 

uid t bi We be 

struct pollfd *poll fay 

int numfd = 1; 

int maxfd = NALLOC; 

if ((pollfd = malloc(NALLOC * sizeof(struct pollfd))) == NULL) 


err_sys("malloc error"); 
fom (1 = Ws A <= NALLOCs i++) f 
pollfd[i].fd = -1; 
pollfd[i].events = POLLIN; 
pollfd[i].revents = 0; 


/* obtain fd to listen for client requests on */ 

if ((listenfd = serv_listen(CS_OPEN)) < 0) 
log_sys("serv_listen error"); 

client_add(listenfd, 0); /* we use [0] for listenfd */ 

pollfd[0].fd = listenfd; 


fen” i yw F 2 of 
if (poll(pollfd, numfd, -1) < 0) 
log_sys ("poll error"); 


if (pollfd[0].revents & POLLIN) { 
/* accept new client request */ 
if ((clifd = serv_accept(listenfd, &uid)) < 0) 
log_sys("serv_accept error: $a", clifd); 
client_add(clifd, uid); 


/* possibly increase the size of the pollfd array */ 
if (numfd == maxfd) 
pollfd = grow_pollfd(pollfd, &maxfd); 
pollfd[numfd].fd = clifd; 
pollfd[numfd].events = POLLIN; 
pollfd[numfd].revents = 0; 
numfd++; 
log msg ("new connection: uid %d, fd dad", uid, clifd); 


for (i = Iz i € numfd; i++) { 

if (pollfd[i].revents & POLLHUP) { 
goto hungup; 

} else if (pollfd[i].revents & POLLIN) { 
/* read argument buffer from client */ 
if ((nread = read(pollfd[i].fd, buf, MAXLINE)) < 0) 

log_sys ("read error on fd %d", pollfd[i].fd); 
} else if (nread == 0) { 
hungup: 

/* the client closed the connection */ 
log_msg("closed: uid %d, fd %d", 
client[i].uid, pollfd[i].fd); 

client_del(pollfd[i].fd); 


close (pollfd[i].fd); 

if (i < (numfd-1)) | 
/* pack the array */ 
pollfd{i].fd = pollfd(numfd-1] . fd; 
pollfd[i].events = pollfd(numfd-1] .events; 








pollfd{i].revents = pollfd[numfd-1] .revents; 
i=; /* recheck this entry */ 
} 
numfd--; 
} else { /* process client's request */ 
handle request (buf, nread, pollfd{i].fd, 
client [1] uid) ; 


图 17-30 使 用 poll 的 loop 函 数 

为 使 打开 描述 符 的 数量 能 与 客户 进程 数量 相当 ， 我 们 动态 地 为 
pollfd 结 构 的 数字 分 配 空间 ， 所 使 用 的 策略 与 client_alloc 函 数 分 配 client 
数组 ( 见 图 17-27〉 时 所 使 用 的 相同 。 

pollfd 数 组 中 的 第 一 个 登记 项 (下 标号 为 0; 用 于 listenfd 摘 述 符 。 新 
客户 进程 连接 的 到 达 由 listenfd 描 述 符 中 的 POLLIN 指 示 。 如 同 前 述 ， 调 
用 serv_accept 来 接受 该 连接 。 

对 于 一 个 现 有 的 客户 进程 ， 应 当 处 理 来 自 pol 的 两 个 不 同事 件 : 由 
POLLHUP 指 示 的 客户 进程 终止 ， 由 POLLIN 指 示 的 来 自 现 有 客户 进程 的 
一 个 新 请 求 。 即 使 连接 的 服务 器 端 还 在 读 取 数据 ， 客 户 端 也 能 够 关闭 它 
这 端的 连接 。 即 使 连接 的 一 端 已 经 被 标记 为 挂 起 状态 ， 服 务 器 仍然 可 以 
读 取 在 它 那 端 队 列 里 的 数据 。 当 然 ， 服 务 器 在 收 到 客户 端的 挂 起 消息 时 
用 close 关 闭 到 客户 端的 连接 ， 可 有 效 地 抛弃 所 有 队列 里 的 数据 。 剩 下 的 





请 求 也 没 必要 处 理 ， 因 为 我 们 已 经 无 法 发 回 啊 应 的 信息 。 

如 同 此 函数 的 Select 版 本 ， 调 用 request 函 数 〈 见 图 17-31) 处 理 来 自 
客户 进程 的 新 请 求 。 此 函数 类 似 于 其 早期 版 本 〈 见 图 17-22， 。 它 调用 
同一 函数 buf_args( 见 图 17-23) ，buf_args 义 调用 dli_args〈 见 图 17- 

24) ， 但 是 ， 因 为 它 是 在 一 个 守护 进程 中 运行 的 ， 所 以 它 在 日 志文 件 中 
记录 出 错 消息 ， 而 不 是 在 标准 错误 上 打印 它们 。 











#include  "opend.h" 
#include <font]. h> 


void 
handle request (char *buf, int nread, int clifd, wid t uid) 
| 


int newfd; 


if (buf{nread-1] != 0) { 
snprintf (errmsg, MAXLINE-1, 
"request from uid %d not null terminated; %*,*s\n", 
uld, nread, nread, buf); 
send_err(clifd, -1, errmsg) ; 
return; 


log_msg("request: %s, from uid %d", buf, uid); 


/* parse the arguments, set options */ 
if (buf_args(buf, cli_args) < 0) { 
send err(clifd, -1, errmsg); 
log_msg (errmsg) ; 
return; 


if ((newfd = open(pathname, oflag)) < 0) { 
snprintf (errmsg, MAXLINE-1, "can't open $s: %s\n", 
pathname, strerror(errno)) ; 
send err (clifd, -1, errmsg); 
10g_ msg (errmsg) ; 
return; 


/* send the descriptor */ 
if (send fd(clifd, newfd) < 0) 
log_sys("send_fd error") ; 
log_msg("sent fd sd over fd sd for %s", newfd, clifd, pathname); 
close(newfd);  /* we're done with descriptor */ 


图 17-31 request PK žit 
这 就 完成 了 open 服 务 器 进程 第 2 版 ， 它 仅 使 用 一 个 守护 进程 就 处 理 
了 所 有 的 客户 进程 请 求 。 


17.7 小 结 


本 章 的 关键 点 是 如 何在 两 个 进程 之 间 传 送 文 件 描述 符 ， 以 及 服务 器 
进程 如 何 接受 来 自 客 户 进程 的 唯一 连接 。 虽 然 所 有 平台 都 支持 UNIX 域 
套 接 字 ( 见 图 15-1) ， 但 是 各 种 实现 都 有 不 同 之 处 ， 这 使 我 们 很 难 开发 
可 移植 的 应 用 程序 。 

整 章 都 使 用 了 UNIX 域 套 接 字 。 我 们 了 解 了 如 何 用 它们 来 实现 一 个 
全 双 工 的 管道 以 及 如 何 利 用 它们 来 适应 14.4 节 的 1/O 多 路 转 接 函数 以 间接 
地 用 于 XSI 消 息 队 列 中 。 

本 章 给 出 了 open 服 务 器 进程 的 两 个 版 本 。 一 个 版 本 由 客户 进程 用 
fork 和 exec 直 接 调用 ， 另 一 版 本 是 个 守护 服务 器 进程 处 理 所 有 客户 进 
程 请 求 。 这 两 个 版 本 均 采 用 文件 描述 符 传送 和 接收 函数 。 

我 们 还 展示 了 如 何 使 用 getopt SOR WEE 令 行 参数 处 理 的 一 致 
性 。 最 终 的 open 服务 器 进程 版 本 使 用 了 getopt 水 数 、17.3 市 中 引入 的 客 
户 进 程 -服务 器 进程 连接 函数 和 14.4 节 中 的 W/O 多 路 转 接 函 数 。 











习题 


17.1 ”我 们 选择 使 用 图 17-3 中 的 UNIX 域 数据 报 套 接 字 ， 因 为 它们 能 
够 保留 消息 边界 。 描 述 如 果 使 用 常规 的 管道 实现 需要 哪些 必要 的 改动 。 
我 们 应 当 如 何 避 免 额 外 的 两 次 消息 复制 呢 ? 

17.2 “使 用 本 章 摘 述 的 文件 描述 符 传 送 函 数 以 及 8.9 节 中 描述 的 父 进 
程 和 子 进程 同步 例 程 ， 编 号 具有 下 列 功 能 的 程序 。 该 程序 调用 fork， 子 
进程 打开 一 个 现 有 的 文件 并 将 打开 文件 描述 符 传 送 给 父 进 程 。 然 后 ， 子 
进程 调用 lseek 确 定 该 文件 的 当前 读 、 写 位 置 ， 通 知 父 进程 。 父 进程 读 该 
文件 的 当前 偏 移 量 ， 并 打印 它 以 便 验 证 。 若 此 文件 按 上 述 方式 从 子 进程 
传递 到 父 进 程 ， 则 父 进 程 和 子 进程 应 共享 同一 个 文件 表 项 ， 所 以 当 子 进 
程 每 次 更 改 该 文件 当前 偏 移 量 时 ， 这 种 更 改 应 该 也 会 影响 父 进程 的 描述 
符 。 使 子 进程 将 该 文件 定位 至 一 个 不 同 偏 移 量 ， 并 再 次 通知 父 进程 。 

17.3 图 17-20 和 图 17-21 中 的 程序 分 别 定 义 和 声 明了 全 局 变量 ， 两 者 
的 区 别 是 什么 ? 

17.4 改写 buf _ args 函数 〈 见 图 17-23) ， 删 除 其 中 对 argv 数 组 长 度 的 
编译 时 限制 。 请 用 动态 存储 分 配 。 

17.5 描述 优化 图 17-29 和 图 17-30 中 的 loop 函 数 的 方法 ， 并 实现 之 。 

17.6 在 serv_listen 函 数 《〈 见 图 17-8) 中 ， 如 果 文 件 已 经 存在 ， 我 们 要 
先 对 代表 UNIX 域 套 接 字 的 文件 名 解除 链接 。 为 了 防止 误 删 除 不 是 套 接 
ea ei 我 们 可 以 先 调用 stat 来 验证 文件 类 型 。 解 释 这 种 做 法 存在 的 

上 问题 。 

17.7 请 给 出 两 种 可 能 的 方法 ， 使 得 单 次 调用 sendmsg 可 以 传递 多 个 
ene 尝试 实现 你 的 方法 并 验证 你 的 操作 系统 是 否 支持 这 样 的 方 
法 。 





























第 18 章 终 新 1/O 


18.1 5| Æ 


无 论 在 哪 种 操作 系统 中 ， 终 端 VO 的 处 理 都 是 非常 繁琐 的 一 部 分 ， 
UNIX 系统 也 不 例外 。 在 大 多 数 版 本 的 编程 手册 中 ， 终 端 VO 手 册页 常常 
是 最 长 的 几 个 部 分 之 一 。 

在 20 世 纪 70 年 代 后 期 ， 系 统 II 在 V7 的 基础 上 发 展 出 一 套 不 同 的 终 
端 例 程 ， 由 此 使 得 UNIX 终 端 VO 处 理 分 立 为 两 种 不 同 的 风格 。 一 种 是 
系统 [I[[ 的 风格 ， 由 System V 治 续 下 来 ， 另 一 种 是 V7 的 风格 ， 它 成 为 
BSD 派 生 的 系统 终端 IO 处 理 的 标准 。 如 同 信号 一 样 ，POSIX.1 在 这 两 种 
风格 的 基础 上 制定 了 终端 IO 标 准 。 本 章 将 介绍 POSIX.1 的 所 有 终端 函 
数 ， 以 及 某 些 平台 特有 的 增加 部 分 。 

终端 VO 系统 之 所 以 如 此 复杂 ， 部 分 原因 是 人 们 将 其 应 用 在 众多 的 
事物 上 : 终端 、 计 算 机 之 间 的 直接 连接 、 调 制 解 调 器 以 及 打印 机 等 。 








18.2 综述 


终端 IO 有 了 两 种 不 同 的 工作 模式 。 

(1) 规范 模式 输入 处 理 。 在 这 种 模式 中 ， 对 终端 输入 以 行为 单位 
进行 处 理 。 对 于 每 个 读 请 求 ， 终 端 驱动 程序 最 多 返回 一 行 。 

(2) 非 规范 模式 输入 处 理 。 输 入 字符 不 装配 成 行 。 

如 果 不 做 特殊 处 理 ， 则 默认 模式 是 规范 模式 。 例 如 ， 知 shel 将 标准 
输入 重 定 向 到 终端 ， 并 用 read 和 write 将 标准 输入 复制 到 标准 输出 ， 则 终 
端 以 规范 模式 进行 工作 ， 每 次 read 最 多 返回 一 行 。 处 理 整 个 屏幕 的 程序 
(如 vi 编辑 器 ) 使 用 非 规范 模式 ， 原 因 是 它 的 命令 可 能 是 由 单个 字符 
组 成 的 ， 并 且 不 以 换行 符 终 止 。 另 外 ， 该 编辑 器 并 不 希望 系统 对 特殊 字 
符 进 行 处 理 ， 因 为 这 些 字符 很 可 能 与 编辑 命令 中 使 用 的 字符 重 若 。 例 
如 ，Ctrl+D 字 符 通 常 是 终端 的 文件 结束 符 ， 但 在 vi 中 它 是 向 下 滚动 半 个 
屏幕 的 命令 。 

V7 和 较 早 的 BSD 风 格 类 的 终端 驱动 程序 文 持 3 种 终端 输入 模式 : 
Ca) 精细 加 工 模式 〈 输 入 装配 成 行 ， 并 对 特殊 字符 进行 处 理 ) ; Cb) 
原始 模式 〈 输 入 不 装配 成 行 ， 也 不 对 特殊 字符 进行 处 理 ) ; Cc) cbreak 
模式 (输入 不 装配 成 行 ， 但 对 某 些 特殊 字符 进行 处 理 ) 。 图 18-20 显 示 
了 将 终端 设置 为 cbreak 或 原始 模式 的 POSIX.1 函 数 。 

POSIX.1 定 义 了 11 个 特殊 输入 字符 ， 其 中 9 个 可 以 更 改 。 本 书 已 经 用 
到 了 其 中 几 个 ， 例 如 文件 结束 符 (通常 是 Ctl+D)〉 和 挂 起 字符 (通常 是 
Ctrl+Z) 。18.3 节 将 对 这 些 字符 逐一 进行 说 明 。 

可 以 认为 终端 设备 是 由 通常 位 于 内 核 中 的 终端 驱动 程序 控制 的 。 每 
个 终端 设备 都 有 一 个 输入 队列 和 一 个 输出 队列 ， 如 图 18-1 所 示 。 


























进程 写 的 下 一 个 字符 进程 读 的 下 一 个 字符 


| | | 
rp 


| | MAX INPUT ———» 


传送 到 设备 的 从 设备 中 读 取 的 
下 一 个 学 符 下 一 个 字条 
图 18-1 终端 设备 的 输入 、 输 出 队列 的 逻辑 结构 
对 此 图 要 说 明 以 下 几 点 。 


人 ee 
IE 六 

输入 队列 的 长 度 MAX_INPUT( 见 图 2-11) 是 有 限 值 。 当 一 个 特定 
设备 的 输入 队列 已 经 填 满 时 ， 系 统 的 行为 将 依赖 于 实现 。 这 种 情况 发 生 
时 大 多 数 UNIX 系 统 回 显 响 铃 字符 。 

。 图 中 没有 显示 另 一 个 输入 限制 MAX CANON。 这 个 限制 是 一 个 规 
范 输入 行 的 最 大 字 节 数 。 

虽然 输出 队列 的 长 度 通 常 也 是 有 限 的 ， 但 是 程序 并 不 能 获得 这 个 
定义 其 长 度 的 常量 ， 因 为 当 输 出 队列 将 要 填 满 时 ， 内 核 便 直接 使 写 进 程 
休眠 ， 直 至 写 队 列 中 有 可 用 的 空间 。 

我们 将 说 明 如 何 使 用 冲洗 函数 tcflush 冲洗 输入 或 输出 队列 。 与 此 
类 似 ， 在 说 明 tcsetattr 函数 时 ， 将 会 了 解 到 如 何 通 知 系统 只 有 在 输出 队 
列 为 空 时 ， 才 能 改变 一 个 终端 的 属性 。 例如 ， 想 要 改变 输出 属性 时 就 
要 这 样 做 。) 也 可 以 通知 系统 ， 让 它 在 改变 终端 属性 时 丢弃 输入 队列 中 
的 所 有 东西 。 如果 正在 改变 输入 属性 ， 或 者 在 规范 模式 和 非 规范 模式 
之 间 进 行 转换 ， 就 需要 这 样 做 ， 以 免 以 错误 的 模式 对 以 前 输入 的 字符 进 


D 
一 








KER UNIX 系统 在 一 个 称 为 终端 行规 程 Germinal line 
discipline) 的 模块 中 进行 全 部 的 规范 处 理 。 可 以 将 这 个 模块 设想 成 一 个 
盒子 ， 位 于 内 核 通 用 读 、 写 函数 和 实际 设备 驱动 程序 之 间 〈 见 图 18- 





2 
用 户 进 程 





实际 设备 


图 18-2 终端 行规 程 
由 于 将 规范 处 理 分 离 为 单独 的 模块 ， 所 有 的 终端 驱动 程序 都 能 够 一 
致 地 文 持 规范 处 理 。 在 第 19 章 讨论 伪 终 端 时 还 将 使 用 此 图 。 
所 有 可 以 检测 和 更 改 的 终端 设备 特性 都 包含 在 termios 结构 中 。 议 
结构 定义 在 头 文件 <termios.h> 中 ， 本 章 使 用 这 一 头 文件 。 
cc_t c_cc[NCCS]; /* control characters */ 
tcflag_t c_lflag; /* local flags */ 








tcflag_t c_cflag; /* control flags */ 

tcflag_t c_oflag; /* output flags */ 

tcflag_t c_iflag; /* input flags */ 
struct termios { 





}; 

粗略 地 说 ， 输 入 标志 通过 终端 设备 驱动 程序 控制 字符 的 输入 《〈 例 
如 ， 和 剥 除 输 入 字 节 的 第 8 位 ， 人 允许 输入 奇 借 校 验 ) ， 输 出 标志 则 控制 驱 
动 程序 输出 〈 例 如 ， 执 行 输出 处 理 、 将 换行 符 转 换 为 CRMLF) ， 控 制 标 
志 有 影响 RS-232 串 行 线 ( 例 如， 忽略 调制 解 调 器 的 状态 线 、 每 个 字符 的 一 
个 或 两 个 停止 位 ) ， 本 地 标志 影响 驱动 程序 和 用 户 之 间 的 接口 (例如 ， 
回 显 打开 或 关闭 、 可 视 地 擦 除 字 符 、 人 允许 终端 产生 的 信号 以 及 对 后 台 输 
出 的 作业 控制 停止 信号 ) 。 

类 型 tcflag t 的 长 度 足 以 保存 每 个 标志 值 ， 它 经 常 被 定义 为 unsigned 
int 或 者 unsigned long。c_cc 数 组 包含 了 所 有 可 以 更 改 的 特殊 字符 。NCCS 
是 该 数组 中 元 素 的 数量 ， 其 典型 值 在 15 一 20《〈 因 为 大 多 数 UNIX 实 现 文 
持 的 特殊 字符 都 比 POSIX.1 所 定义 的 11 个 要 多 ) 。cc_t 类 型 的 长 度 足 以 
保存 每 个 特殊 字符 ， 典 型 的 是 unsigned char. 

POSIX 标 准 之 前 的 System ”V 版 本 有 一 个 名 为 <termio.h> 的 尖 文 件 和 
一 个 名 为 termio 的 数据 结构 。 为 了 与 先前 版 本 有 所 区 别 ，POSIX.1 在 这 
些 名 字 后 加 了 一 个 s。 

图 18-3 至 图 18-6 列 出 了 所 有 可 以 更 改 以 影响 终端 设备 特性 的 终端 
标志 。 注 意 ， 虽 然 Single UNIX Specification 定 义 了 供 所 有 平台 启动 所 用 
的 公共 子 集 ， 但 所 有 实现 都 有 自己 的 扩充 部 分 。 这 些 扩 充 部 分 大 多 来 自 
各 系统 之 间 的 历史 差异 。18.5 节 将 对 这 些 标志 值 进 行 详细 的 讨论 。 

















CBAUDEXT 
CCAR_OFLOW 
CCTS_OFLOW 
CDSR_OFLOW 
CDTR_IFLOW 
CIBAUDEXT 
CIGNORE 
CLOCAL 
CMSPAR 
CREAD 
CRISCTS 
CRTS_IFLOW 
CRISXOFF 
(SIZE 
CSTOPB 
HUPCL 
MDMBUF 
PARENB 
PAREXT 
PARODD 
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扩充 的 波 特 率 

输出 的 DCD 流 控制 
输出 的 CTS 流 控制 
输出 的 DSR 流 控制 
MAHI DTR 流 控制 
扩充 输入 波 特 率 

忽略 控制 标志 

忽略 调制 解 调 器 状态 生 
标记 或 空 奇偶 性 

月 用 接收 装置 

月 用 硬件 流 控制 
输入 的 RTS 流 控制 
启用 输入 硬件 流 控制 
字符 大 小 屏 赦 字 

发 送 两 个 停止 位 , 否则 发 送 1 位 
最 后 关闭 时 挂 断 

与 CCAR OFLOW 相同 
局 用 奇偶 校 验 
标记 或 空 奇 个 性 

奇 校 验 ， 否 则 为 个 校 验 


图 18-3 c_cflag 终 端 标志 


Mac OS X 


Solaris 


ae a 3 a 





Linux MacOSX Solaris 
ind 


SRK | YABREAK MEE sion | | BREAK 时 产生 SIGINT 
ICRNL | 将 输入 的 CR 转换 为 NL 
IGNBRK | 忽略 BREAK 条 件 

IGNCR | 忽略 CR 

IGNPAR | 忽略 奇 个 校 验 出 错 的 字符 
IMAXBEL | 在 输入 队列 满 时 振 铃 

INLCR | 将 输入 的 NL 转换 为 CR 
INPCK “| 打开 输入 奇 个 校 验 

ISTRIP | 剥 除 输 入 字符 的 第 8 位 
IUCLC “| 将 输入 的 大 写字 得 转换 成 小 写字 符 
IUTF8 | RAX UT- 

IXANY | 使 任何 字符 者 重新 月 动 输出 
IXOFF | 使 局 用 /禁用 输入 流 控 制 起 作用 
IXON “| 使 局 用 /禁用 输出 流 控制 起 作用 
PARMRK | 标记 奇偶 检验 错误 





图 18-4 c_iflag 终 端 标志 
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RAHA WERASES WERASE 算法 


ALIWERASE | 


ECHO PANE 
回 显 控制 字符 为 ^ (Char) 
可 视 地 探 除 字符 
PATA 
ASEAN AT UFR 
li NL 
EENT RR TA 


ECHOCTL 
ECHOE 
ECHOK 
ECHOKE 
ECHONL 
ECHOPRT 
EXTPROC 
FLUSHO 
ICANON 
IEXTEN 
ISTIG | aaa 
NOFLSH 
NOKERNINFO 


外 部 字符 处 理 
冲洗 输出 
规范 输入 
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使 扩充 的 输入 字符 处 理 起 作用 
号 起 作用 
在 中 断 或 退出 后 不 冲洗 


PENDIN 
TOSTOP 
XCASE 


无 来 自 STATUS 的 内 核 输出 
重新 键入 未 决 输入 

对 于 后 合 输出 发 送 SIGTTOU 
规范 的 大 /小 写 表示 





给 出 了 所 有 可 用 的 选项 后 ， 如 何 才能 检测 和 更 改 终 3 


图 18-5 c_lflag 终 端 标 志 
前 设备 的 这 些 特 


性 呢 ? 图 18-7 总 结 并 列 出 了 Single UNIX Specification 所 定义 的 对 终端 设 


备 进 行 操 作 的 各 个 函数 。 


成 部 分 
注意 ， 对 终端 


〈 列 出 的 所 有 函数 都 是 POSIX 基本 规范 的 组 


。9.7 节 已 说 明了 tcgetpgrp、tcgetsid 和 tcsetpgrp 函 数 。) 
设备 ，Single 


UNIX ”Specification 没有 使 用 经 典 的 


ioctl， 而 是 使 用 了 图 18-7 中 列 出 的 13 个 函数 。 这 样 做 的 理由 是 : 对 于 终 
端 设备 的 ioctl 函 数 ， 其 最 后 一 个 参数 的 数据 类 型 随 执行 动作 的 不 同 而 改 
变 。 因 此 ， 不 可 能 对 参数 进行 类 型 检查 。 
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ET 

CR ERRI 

换 页 延迟 屏 项 字 

NL Sei RE 

将 输出 的 CR 映射 为 NL 
HAAA DEL, TNA NUL 
延迟 使 用 填充 符 

将 输出 的 小 写字 符 映射 为 大 写字 符 
将 NL 了 映射 为 CR-NL 
ONLRET | NL 执行 CR 功能 

ONOCR | 在 0 列 不 输出 CR 
ONOEOT | 在 输出 中 丢弃 EOT FH (^D) 
OPOST | 执行 输出 处 理 

0XTABS | 将 制 表 符 扩充 为 空格 
TABDLY | 水 平 制 表 符 延 迟 屏 敬 字 
VIDLY | EER RS 











图 18-6 c_oflag 终 端 标志 


tcgetattr 
tcsetattr 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
tcdrain 
tcflow 
tcflush 
tcsendbreak 
tcgetpgrp 
tcsetpgrp 
tcgetsid 





获取 属性 (termios 结构 ) 
设置 属性 (termios 结构 ) 
获得 输入 速度 

获得 输出 速度 

设置 输入 速度 

设置 输出 速度 

等 待 所 有 输出 都 被 传输 
挂 起 传输 或 接收 

冲洗 未 决 输入 和 /或 输出 
发 送 BREAK 字符 
获得 前 台 进 程 组 ID 
设置 前 台 进 程 组 ID 

得 到 控制 TTY 的 会 话 首 进程 的 进程 组 ID 


图 18-7 终端 WO 函数 汇总 


虽然 在 终端 设备 上 进行 操作 的 只 有 13 个 函数 ， 但 是 图 18-7 中 的 前 两 
个 函数 〈tcgetattr 和 tcsetattr) 能 处 理 大 约 70 种 不 同 的 标志 ( 见 图 18-3 至 
图 18-6) 。 终 端 设备 有 大 量 选 项 可 供 使 用 ， 此 外 ， 对 于 某 个 特定 设备 
(假设 其 为 终端 、 调 制 解 调 器 、 打 印 机 或 任何 其 他 设备 ) ， 决 定 其 需要 
哪些 选项 对 我 们 来 说 也 是 一 种 挑战 ， 这 些 都 使 得 对 终端 设备 的 处 理 变 得 


异常 复杂 。 


图 18-7 中 列 出 的 13 个 函数 之 间 的 关系 如 图 18-8 所 示 。 
POSIX.1 没 有 指定 将 波 特 率 信息 存储 在 termios 结 构 中 的 什么 地 方 ， 








它 依赖 于 实现 的 细节 。 某 些 系统 ， 如 Solaris， 将 此 信息 存储 在 c_cflag 字 
段 中 。Linux 和 BSD 派 生 的 系统 ， 如 FreeBSD 和 Mac OS X， 则 在 此 结构 
中 有 两 个 分 开 的 字段 : 一 个 存储 输入 速度 ， 另 一 个 存储 输出 速度 。 


posdsoyscobzo 
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图 18-8 与 终端 有 关 的 各 函数 之 间 的 关系 


18.3 特殊 输入 字符 


POSIX.1 定义 了 11 个 在 输入 时 要 特殊 处 理 的 字符 。 实 现 定义 了 为 
外 一 些 特殊 字符 。 图 18-9 总 结 并 列 出 了 这 些 特殊 字符 。 
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图 18-9 终端 特殊 输入 字符 汇总 
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图 18-9 终端 特殊 输入 字符 汇总 〈 续 ) 

在 POSIX.1 的 11 个 特殊 字符 中 ， 其 中 有 9 个 字符 的 值 可 以 任意 更 改 。 
不 能 更 改 的 两 个 特殊 字符 是 换行 符 和 回 车 符 〈 分 别 是 m 和 NT) ， 也 可 能 
是 STOP 和 START 字 符 〈 依 赖 于 实现 ) 。 为 了 更 改 ， 只 需要 修改 termios 
结构 中 cce 数组 的 相应 项 。 该 数组 中 的 元 素 都 用 名 字 作 为 下 标 进行 引 
用 ， 每 个 名 字 都 以 字母 VY 开 头 〈 见 图 18-9 中 的 第 3 列 ) 。 

POSIX.1 人 允许 禁止 使 用 这 些 字 符 。 若 将 c_cc 数 组 中 的 某 项 设置 为 
_POSIX_VDISABLE 的 值 ， 则 禁止 使 用 相应 特殊 字符 。 

在 Single UNIX Specification 的 早期 版 本 中 ， 文 持 
_POSIX_VDISABLE 是 可 选项 ， 现 在 则 是 必 选 项 。 

本 书 讨论 的 4 种 平台 都 支持 此 特性 。Linux ”3.2.0 和 Solaris 101% 
_POSIX_VDISABLE 定 义 为 0， 而 FreeBSD 8.0 和 Mac OS X 10.6.8 则 将 其 
定义 为 0xff。 

某 些 早期 的 UNIX 系 统 所 用 的 方法 是 : 若 与 某 一 特性 相应 的 特殊 输 
ee 则 禁止 使 用 该 特性 。 

SEA 

在 详细 说 明 各 特殊 字符 之 前 ， 先 看 一 个 更 改 特殊 字符 的 小 程序 。 图 
18-10 所 示 的 程序 禁用 中 断 字 符 ， 并 将 文件 结束 符 设置 为 Ctrl+B。 








tinclude "apue.h" 
Hinclude <termios,h> 


int 
main (void) 
| 
struct termios term; 


long vdisable; 


if (isatty(STDIN FILENO) == 0) 
err quit("standard input is not a terminal device"); 


if ((vdisable = fpathconf (STDIN FILENO, PC VDISABLE)) < 0) 
err quit("fpathconf error or POSIX VDISABLE not in effect"); 


if (tcgetattr (STDIN FILENO, &term) < 0) /* fetch tty state */ 
err_sys("tcgetattr error"); 


term.c_cc[VINTR] = vdisable; /* disable INTR character */ 
term,c cc[VEOF] = 2; /* EOF is Control-B */ 


if (tcsetattr (STDIN FILENO, TCSAFLUSH, &term) < 0) 


err sys("tcsetattr error"); 


exit (0); 























图 18-10 禁用 中 断 字 符 并 更 改 文件 结束 符 

对 此 程序 要 说 明 以 下 几 点 。 

。 仅 当 标 准 输入 是 终端 设备 时 才 修 改 终端 特殊 字符 。 调 用 isatty 〈 见 
18.9 节 ) 对 此 进行 检测 。 

。 用 fpathconf 获 取 _POSIX_VDISABLE 值 。 

“PX tcgetattr〈 见 18.4 节 ) 从 内 核 获 取 termios 结构 。 在 修改 了 此 
结构 后 ， 调 用 tcsetattr 函数 设置 属性 ， 只 有 我 们 所 希望 修改 的 属性 被 更 
改 了 ， 而 其 他 属性 保持 不 变 。 

。 禁 用 中 断 键 与 忽略 中 断 信号 是 不 同 的 。 图 18-10 中 的 程序 所 做 的 只 
是 禁用 使 终端 驱动 程序 产生 SIGINT 信 号 的 特殊 字符 。 我 们 仍 可 使 用 kill 
函数 将 该 信号 发 送 至 进程 。 

下 面 较 详 细 地 说 明 各 个 特殊 字符 。 我 们 称 这 些 字符 为 特殊 输入 字 
符 ， 但 是 其 中 有 两 个 字符 一 STOP 和 START (CCtr+S 和 Ctrl+Q) ， 在 输 
出 时 也 要 进行 特殊 处 理 。 注 意 ， 这 些 字 符 中 的 大 多 数 在 被 终端 驱动 程序 
识别 并 进行 特殊 处 理 后 会 被 丢弃 ， 并 不 将 它们 返回 给 执行 读 终端 操作 的 
进程 。 返 回 给 读 进 程 的 例外 字符 是 换行 符 CNL. EOL. EOL2) 和 回 车 
符 CCR) 。 

CR ， 回 车 符 。 不 能 更 改 此 字符 。 以 规范 模式 进行 输入 时 识别 此 字 
符 。 在 已 设置 ICANON (MIRA) 和 ICRNL (将 CR 映射 为 NL) 但 并 
未 设置 IGNCR (忽略 CR) 时，CR 字 符 会 被 转换 成 NL， 并 具有 与 NLS 
符 相 同 的 作用 。 此 字符 返回 给 读 进 程 ( 很 可 能 是 在 转换 为 NL 之 后 )。 

DISCARD 丢弃 符 。 在 扩充 模式 (IEXTEN) 下 进行 输入 时 识别 此 
字符 。 在 输入 男 一 个 DISCARD 字 符 之 前 或 在 丢弃 条 件 被 清除 之 前 ( 见 
FLUSHO 选项 ) ， 此 字符 使 后 续 输 出 都 被 丢弃 。 此 字符 在 处 理 后 即 被 丢 
弃 〈 即 不 传送 给 读 进程 ) 。 

DSUSP 延迟 挂 起 作业 控制 字符 (delayed-suspend  job-control 
character) 。 在 扩充 模式 (IEXTEN) 下 ， 若 支持 作业 控制 ， 并 月 已 设 
置 ISIG 标 志 ， 则 在 输入 时 识别 此 字符 。 与 SUSP 字 符 的 相同 之 处 是 : 延 
述 挂 起 字符 产生 SIGTSTP 信 号 ， 该 信号 被 发 送 至 前 台 进 程 组 中 的 所 有 进 
程 〈 见 图 9-7) 。 但 是 ， 信 号 产生 的 时 间 并 不 是 在 键入 延迟 挂 起 字符 之 
时 ， 而 是 在 某 个 进程 从 控制 终端 读 到 此 字符 时 才 产 生 。 此 字符 在 处 理 后 
即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 。 

EOF ”文件 结束 符 。 以 规范 模式 CANON) 进行 输入 时 识别 此 字 
符 。 当 键入 此 字符 时 ， 等 待 被 读 的 所 有 字 节 都 被 立即 传送 给 读 进程 。 如 
果 没 有 字 节 等 待 读 ， 则 返回 0。 在 行 首 输入 一 个 EOF 字符 是 辣 程 序 指示 
式 。 此 字符 在 规范 模式 下 处 理 后 即 被 丢弃 〈 即 不 传送 
给 恋 进 程 ) 。 






































EOL 附加 的 行 定 界 符 ， 与 NL 作用 相同 。 以 规范 模式 (CANON) 
o 并 将 此 字符 返回 给 读 进 程 。 但 是 此 字符 不 常 

EOL2 男 一 个 行 定 界 符 ， 与 NL 作用 相同 。 对 此 字符 的 处 理 方 式 与 
EOL 字 符 相 同 。 

ERASE ”向 前 擦 除 字 符 ( 退 格 )。 以 规范 模式 (CANON) 输入 时 
识别 此 字符 。 它 擦 除 行 中 的 前 一 个 字符 ， 但 不 会 超越 行 首 字符 擦 除 上 一 
Ta 此 字符 在 规范 模式 下 处 理 后 即 被 丢弃 MERA 
T) 。 

ERASE2 供 替换 的 向 前 擦 除 字 符 ( 退 格 )。 对 此 字符 的 处 理 与 向 前 
擦 除 字符 (ERASE) 完全 相同 。 

INTR 中断 字 符 。 若 已 设置 ISIG 标 志 ， 则 在 输入 中 识别 此 字符 。 它 
产生 SIGINT 信 号 ， 该 信号 被 送 至 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9- 

7) 。 此 字符 在 处 理 后 即 被 丢弃 《〈 即 不 传送 给 读 进 程 ) 。 

KILL AH. 名字“ 杀 死 ”在 这 里 又 一 次 被 误 用 ，kill 函 数 是 用 
来 将 某 一 信号 发 送 给 进程 的 ， 而 此 字符 应 被 称 为 行 控 除 符 ， 它 与 信号 宣 
无 关系 。) 以 规范 模式 GCANON) 输入 时 识别 此 字符 。 它 擦 除 一 整 
行 ， 并 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 。 

LNEXT 下 一 个 字符 的 字面 值 (iteral-next character) 。 以 扩充 方式 
(IEXTEN) 输入 时 识别 此 字符 ， 它 使 下 一 个 字符 的 任何 特殊 含意 都 被 
忽略 。 这 对 本 节 提 及 的 所 有 特殊 字符 都 起 作用 。 使 用 这 一 字符 可 回程 序 
键入 任何 字符 。LNEXT 字 符 在 处 理 后 即 被 丢弃 ， 但 输入 的 下 一 个 字符 

被 传送 给 读 进 程 。 

NL 换行 字符 ， 也 被 称 为 行 定 界 符 。 不 能 更 改 此 字符 。 以 规范 模式 
(ICANON) 输入 时 识别 此 字符 。 此 字符 返回 给 读 进 程 。 

QUIT 退出 字符 。 知 已 设置 ISIG 标 志 ， 则 在 输入 中 识别 此 字符 。 它 
产生 SIGQUIT 信 号 ， 该 信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9- 
7) 。 此 字符 在 处 理 后 即 被 丢弃 《〈 即 不 传送 给 读 进 程 ) 。 

回忆 图 10-1，INTR 和 QUIT 的 区 别 是 : QUIT 字符 不 仪 按 默认 规则 终 
止 进程 ， 而 且 还 产生 一 个 core 文 件 。 

REPRINT ”再 打印 字符 。 以 扩充 规范 模式 〈 设 置 了 IEXTEN 和 和 
ICANON 标 志 ) 进行 输入 时 识别 此 字符 。 它 使 所 有 未 读 的 输入 被 输出 
CHET) 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 。 

START 启动 字符 。 若 已 设置 IXON 标 志 ， 则 在 输入 中 识别 此 字符 。 
知已 设置 IXOFEF 标 志 ， 则 自动 产生 此 字符 作为 输出 。 已 设置 IXON 时 ， 
接收 到 的 START 字符 使 停止 的 输出 〈 由 以 前 输入 的 STOP 字 符 造 成 ) 重 
新 启动 。 在 此 情形 下 ， 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 











FE) 。 
STATUS BSD 的 状态 请 求 字符 。 以 扩充 规范 模式 〈 设 置 了 IEXTEN 
和 ICANON 标志 ) 进行 输入 时 识别 此 字符 。 它 产生 SIGINFO 信 和 号， 该 
信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9-7) 。 男 外 ， 如 果 没 有 
设置 NOKERNINFO 标 志 ， 则 有 关 前 台 进 程 组 的 状态 信息 也 显示 在 终端 
上 上。 此 字符 在 处 理 后 即 被 丢弃 〈( 即 不 传送 给 读 进 程 〉。 

STOP 停止 字符 。 知 已 设置 IXON 标 志 ， 则 在 输入 中 识别 此 字符 。 和 大 
己 设置 [XOFF 标 志 ， 则 自动 产生 此 字符 作为 输出 。 已 设置 IXON 时 ， 接 
收 到 STOP 字 符 则 停止 输出 。 在 此 情形 下 ， 此 字符 在 处 理 后 即 被 丢弃 
| 。 当 输入 一 个 START 字 符 后 ， 被 停止 的 输出 重新 
HA o 

SUSP 挂 起 作业 控制 字符 。 知 文 持 作 业 控 制 并 且 已 设置 ISIG 标 志 ， 
则 在 输入 中 识别 此 字符 。 它 产生 SIGTSTP 信 和 号， 该 信号 又 被 送 至 前 台 进 
( 见 图 9-7) 。 此 字符 在 处 理 后 即 被 丢弃 〈( 即 不 传送 给 
斌 进程 )。 

已 设置 IXOFF 标志 时 ， 若 新 的 输入 不 会 使 输入 缓冲 区 洪 出 ， 则 终 
端 驱 动 程序 自动 产生 一 个 START 字 符 来 恢复 以 前 被 停止 的 输入 。 

己 设 置 IXOFF 时 ， 终 端 驱动 程序 自动 产生 一 个 STOP 字 符 以 防止 输 














入 缓冲 区 溢出 。 
WERASE 字 擦 除 字 符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 和 


ICANON 标 志 ) 进行 输入 时 识别 此 字符 。 它 使 前 一 个 字 被 擦 除 。 首 先 ， 
它 癌 前 跳 过 任意 一 个 空白 字符 (空格 或 制 表 符 〉 ， 然 后 再 向 前 跃 过 前 一 
记号 ， 使 光标 处 在 前 一 个 记号 的 第 一 个 字符 位 置 上 。 通 常 ， 前 一 个 记号 
在 人 磅 到 一 个 空白 字符 时 即 终 止 。 但 是 ， 可 通过 设置 ALTWERASE 标 志 来 
改变 这 个 行为 。 此 标志 使 前 一 个 记号 在 碰 到 第 一 个 非 字 母 、 非 数字 字符 
时 即 终止 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 ) 。 

需要 为 终端 设备 定义 的 另 一 个 “字符 "是 BREAK 字符 。BREAK 实 
际 上 并 不 是 一 个 字符 ， 而 是 在 异步 串 行 数据 传送 时 发 生 的 一 个 条 件 。 根 
据 行 接 口 的 不 同 ， 可 以 有 多 种 方式 通知 设备 驱动 程序 发 生 了 BREAK 
AR o 

大 多 数 早 期 的 串 行 终端 都 有 一 个 标记 为 BREAK 的 键 ， 用 其 可 以 产 
生 BREAK 条 件 ， 这 就 是 为 什么 大 多 数 人 认为 BREAK 就 是 一 个 字符 的 原 
因 。 某 些 较 新 的 终端 键盘 没有 BREAK 键 。 在 PC 上 ，BREAK 键 可 能 有 其 
他 用 途 。 例 如 ， 键 入 Ctrl+BREAK 可 中 断 Windows 命 令 解释 器 。 

对 于 异步 串 行 数据 传送 ，BREAK 是 一 个 0 值 的 位 序列 ， 其 持续 时 间 
长 于 要 求 发 送 一 个 字 节 的 时 间 。 整 个 0 值 位 序列 被 视 为 是 一 个 BREAK。 
18.8 节 将 说 明 如 何 用 tcsendbreak 函 数 发 送 一 个 BREAK。 














18.4 获得 和 设置 终 靖 属 : 


为 了 获得 和 设置 termios 结 构 ， 可 以 调用 tcgetattr 和 tcsetattr 疯 数 。 这 
样 就 可 以 检测 和 修改 各 种 终 站 选项 标志 和 特殊 字符 ， 使 终端 按 我 们 所 和 希 
望 的 方式 进行 操作 。 

#include <termios.h> 

int tcgetattr(int fd, struct termios *termptr); 

int tcsetattr(int fd, int opt, const struct termios *termptr); 

两 个 图 数 的 返回 值 : ARJ, eo; Arita, JK [el-1 

这 两 个 函数 都 有 一 个 指向 termios 结 构 的 指针 作为 其 参数 ， 它 们 或 者 
返回 当前 终端 的 属性 ， 或 者 设置 该 终端 的 属性 。 因 为 这 两 个 函数 只 对 终 
端 设 备 进行 操作 ， 所 以 大 fd 没有 引用 终端 设备 则 出 错 返 回 -1，ermo 设 置 
为 ENOTTY。 

tcsetattr 的 参数 opt 使 我 们 可 以 指定 在 什么 时 候 新 的 终端 属性 才 起 作 
用 。opt 可 以 指定 为 下 列 常量 中 的 一 个 。 





TCSANOW 更 改 立 即 发 生 。 
TCSADRAIN 发 送 了 所 有 输出 后 更 改 才 发 生 。 知 更 改 输出 参数 则 应 
使 用 此 选项 。 


TCSAFLUSH 发 送 了 所 有 输出 后 更 改 才 发 生 。 更 进一步 ， 在 更 改 发 
生 时 未 读 的 所 有 输入 数据 都 被 丢弃 (冲洗 ) 。 

Tcsetattr 函数 的 返回 状态 在 使 用 时 易 产 生 混淆 。 如 果 它 执行 了 任意 
一 种 所 要 求 的 动作 ， 即 使 未 能 执行 所 有 要 求 的 动作 ， 它 也 返回 OK K 
示 成 功 ) 。 如 果 访 函数 返回 OK， 则 我 们 有 责任 检查 该 函数 是 否 执行 了 
所 有 要 求 的 动作 。 这 就 意味 着 ， 在 调用 tcsetattr 设 置 所 希望 的 属性 后 ， 需 
调用 tcgetattr， 人 然后 将 实际 终端 属性 与 所 和 希望 的 属性 相 比 较 ， 以 检测 两 
者 是 否 有 区 别 。 

在 终端 第 一 次 被 打开 时 ， 其 属性 视 具 体 情 况 而 定 。 一 些 系统 可 能 会 
将 终端 属性 初始 化 为 具体 实现 所 定义 的 值 ， 另 一 些 系 统 可 能 会 保留 并 使 
用 最 后 一 次 使 用 终端 时 的 属性 值 。 通 过 打开 一 个 带 有 O_TTY _INIT 标 志 
〈 见 3.3 节 ) 的 驱动 设备 ， 可 以 确认 终端 的 行为 是 否 遵 循 标准 ， 这 样 就 
能 在 调用 tcgetattr 时 ， 确 保 初 始 化 termios 结 构 中 的 任何 非 标准 部 分 ， 使 
得 在 修改 属性 和 调用 tcgetattr 时 ， 终 端的 表现 符合 预期 。 








18.5 终端 选项 标志 


本 节 将 列 出 所 有 不 同 的 终端 选项 标志 ， 扩 展 图 18-3 至 图 18-6 中 的 说 
明 。 我 们 将 按 字 母 顺 序列 出 各 个 选项 并 指出 每 个 选项 出 现在 4 个 终端 标 
志 字 段 中 的 哪 一 个 。〈 从 选项 名 字 中 看 不 出 它 所 处 的 字段 。) 还 将 说 明 
每 个 选项 是 否 是 Single UNIX Specification 定 义 的 ， 并 列 出 了 文 持 该 选项 
的 平台 。 

列 出 的 所 有 选项 标志 【〔 除 所 谓 的 屏蔽 字 标 志 外 ) 都 用 一 位 或 多 位 
(设置 或 清除 ) 表示 。 屏蔽 字 标志 定义 多 个 位 ， 它们 组 合 在 一 起 ， 可 以 
E 义 一 组 值 。 屏 蔽 字 标 志 有 一 个 定义 名 ， 每 个 值 也 有 一 个 名 字 。 例 如 ， 
为 了 设置 字符 长 度 ， 首 先 用 字符 长 度 屏蔽 字 标 志 CSIZE 将 表示 字符 长 
度 的 位 清 0， 然 后 设置 下 列 值 之 一 : CS5、CS6、CS7 或 CS8。 

由 Linux 和 Solaris 支 持 的 6 个 延迟 值 也 有 屏蔽 字 标 志 : BSDLY、 
CRDLY、FFDLY、NLDLY、TABDLY 和 VTDLY。 对 于 每 个 延迟 值 的 
长 度 请 参阅 Solaris 中 的 termio(7D) 手 册页 。 在 所 有 情况 下 ， 延 迟 屏 蔽 字 为 
0 就 表示 没有 延迟 。 如 果 指 定 了 延迟 ， 则 由 OFILL 和 OFDEL 标 志 雇 定 是 
a eee 

SE Bl 
n 图 18-11 演 示 了 如 何 使 用 这 些 屏蔽 字 标 志 取 一 个 值 或 者 设置 一 个 
































finclude "apue.h" 
tinclude <termios.h> 


int 
main (void) 
| 


struct termios term; 


if (tegetattr (STDIN FILENO, &term) < 0) 
err sys("tcgetattr error"); 


switch (term.c_cflag & CSIZE) { 
case ($5: 
printf ("5 bits/byte\n"); 
break; 
case (S6: 
printf ("6 bits/byte\n"); 
break; 
case CS7; 
printf ("7 bits/byte\n") ; 
break; 
case CS8; 
printf ("8 bits/byte\n") ; 
break; 
default: 
printf ("unknown bits/byte\n") ; 


term.c_cflag &= ~CSIZE; /* zero out the bits */ 
term.c_cflag |= CS8; /* set 8 bits/byte */ 
if (tcsetattr (STDIN FILENO, TCSANOW, &term) < 0) 


err sys("tcsetattr error"); 


exit (0); 





图 18-11 tcgetattr 和 tcsetattr 实 例 

下 面 说 明 各 选项 标志 。 

ALTWERASE (c lflag，FreeBSD、Mac OS X) 已 设置 此 标志 时 ， 
各 输入 WERASE 字 符 ， 则 使 用 一 个 蔡 换 的 字 探 除 算法 。 它 不 是 向 前 移动 
字符 为 止 ， 而 是 问 前 移动 到 第 一 个 非 字 母 、 非 数字 字符 为 

BRKINT (c iflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 若 已 设置 此 标志 ， 而 未 设置 IGNBRK， 则 在 接 到 BREAK 时 ， 
冲洗 输入 、 输 出 队列 ， 并 产生 一 个 SIGINT 信号。 如 果 此 终端 设备 是 一 
个 控制 终端 ， 则 此 信号 就 是 为 前 台 进 程 组 产生 的 。 

若 未 设置 IGNBRK 和 BRKINT， 但 是 设置 了 PARMRK， 则 BREAK 被 
读 作 一 个 3 字 节 序列 \377、\0 和 \0; 车 也 未 设置 PARMRK， 则 BREAK 被 
读 作 单 个 字符 \0。 

BSDLY  (c_oflag, XSI, Linux. Solaris) 退 格 延迟 屏蔽 字 。 此 屏 
菩 字 的 值 是 BS0 或 BS1。 (c_cflag, Solaris) 扩充 的 波 特 率 。 用 于 允许 大 
于 B38400 的 波 特 率 。 (将 在 18.7 节 讨论 波 特 率 。) CBAUDEXT 

CCAR_OFLOW (c_cflag, FreeBSD. Mac OS X) 使 用 RS-232 调 
制 解 调 嚣 DCD (Data-Carrier-Detect， 数 据 载 波 检 测 ) 信号 打开 输出 的 便 
件 流 控制 。 这 与 早期 的 MDMBUF 标 志 相 同 。 

CCTS_OFLOW (c_cflag, FreeBSD. Mac OS X、Solaris) 使 用 RS- 
232 CTS (Clear-To-Send， 清 除 发 送 ) 信号 打开 输出 的 硬件 流 控制 。 

CDSR_OFLOW (c_cflag, FreeBSD, Mac OS X) 根据 RS-232 
DSR (Data-Set-Ready， 数 据 准 备 就 绪 ) 信号 进行 输出 的 流 控 制 。 

CDTR_IFLOW  (c_cflag, FreeBSD, Mac OS X) 根据 RS-232 
DTR (Data-Terminal-Ready， 数 据 终端 就 绪 ) 信号 进行 输入 的 流 控制 。 

CIBAUDEXT (c_cflag，Solaris) 扩充 的 输入 波 特 率 。 用 于 允许 大 





于 B38400 的 输入 波 特 率 。 
(将 在 18.7 节 讨论 波 特 率 。) 

CIGNORE (c_cflag，FreeBSD、Mac OS X) 忽略 控制 标志 。 

CLOCAL (c cflag, POSIX.1、 FreeBSD. Linux, Mac OS X, 
Solaris) 奉 设 置 ， 则 忽略 调制 解 调 占 状态 线 。 这 通常 意味 着 该 设备 是 直 
接连 接 的 。 例 如 ， 若 未 设置 此 标志 ， 则 打开 一 个 终端 设备 常常 会 遭遇 阻 
塞 ， 直 到 调制 解 调 器 回应 呼叫 并 建立 连接 。 

CMSPAR (c_oflag, Linux) 选择 标记 或 空 奇偶 校 验 。 若 已 设置 
PARODD， 则 奇偶 校 验 位 总 是 1《〈 标 记 奇 偶 校 验 ) 。 人 否则 奇偶 校 验 位 总 
是 0〈 衬 奇偶 校 验 ) 。 

CRDLY (c_oflag, XSI, Linux, Solaris) 回 车 延迟 屏蔽 字 。 此 愤 
菩 字 的 可 能 值 是 CR0、CR1、CR2 和 CR3。 

CREAD (c cflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 耕 设 置 ， 则 接收 者 被 局 用， 可 以 接收 字符 。 

CRTSCTS (c_cflag, FreeBSD. Linux, Mac OS X, Solaris) 其 行 
NAKIT ORR. XF Solaris, AREA, M AAR ME Es il. 
在 另外 3 个 平台 上 ， 则 既 允 许 带 内 硬件 流 控 制 ， 又 允许 带 外 硬件 流 控 制 
(等 价 于 CCTS_OFLOWICRTS_IFLOW) 。 

CRTS_IFLOW (c_cflag, FreeBSD. Mac OS X, Solaris) 输入 的 
RTS 〈Request-To-Send， 请 求 发 送 ) 流 控 制 。 

CRTSXOFF (c_cflag, Solaris) 若 设置 ， 则 允许 带 内 硬件 流 控制 ， 
RS-232 RTS 信 号 的 状态 控制 了 流 控制 。 

CSIZE (c_cflag, POSIX.1、 FreeBSD, Linux. Mac OS X, 
Solaris) 此 字段 是 一 个 屏蔽 字 标 志 ， 它 指定 发 送 和 接收 的 每 个 字 节 的 位 
数 。 此 长 度 不 包括 可 能 有 的 奇偶 校 验 位 。 由 此 屏蔽 字 定 义 的 字段 值 是 
CS5、CS6、CS7 和 CS8， 分 别 表示 每 个 字 节 包含 5 位 、6 位 、7 位 和 8 位 。 

CSTOPB (c cflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 和 若 设置 ， 则 使 用 两 个 停止 位 ， 人 否则 只 使 用 一 个 停止 位 。 

ECHO (c lflag, POSIX.1, FreeBSD, Linux. Mac OS X, 
Solaris) 知 设 置 ， 则 将 输入 字符 回 显 到 终端 设备 。 在 规范 模式 和 非 规范 
模式 下 都 可 以 回 显 输入 字符 。 

ECHOCTL (c_lflag, FreeBSD. Linux, Mac OS X, Solaris) 知 设 
置 并 且 也 设置 ECHO， 则 除 ASCII TAB. ASCII NL 以 及 START 和 STOP 
字符 外 ， 其 他 ASCII 控 制 字符 (ASCII 字 符 集 中 0 至 八进制 37 对 应 的 字 
符 ) 都 被 回 显 为 XX， 其 中 ，X 是 相应 控制 字符 加 上 八进制 100 所 构成 的 
字符 。 例 如 ，ASCII Cult AFF C/E) 被 回 显 为 ^A。ASCII 
DELETE 字 符 〈 八 进 制 177) 则 回 显 为 ^?。 若 未 设置 此 标志 ， 则 ASCII 控 












































制 字符 按 其 原样 回 显 。 如 同 ECHO 标 志 ， 在 规范 模式 和 非 规范 模式 下 ， 
此 标志 对 控制 字符 回 显 都 起 作用 。 

应 当 了 解 的 是 ， 某 些 系 统 以 不 同方 式 回 显 EOF 字 符 ， 因 为 EOF 的 典 
型 值 是 Ctrl+tD (而 Ctrl+D 是 ASCIT ”EOT 字 符 ， 它 可 能 使 某 些 终端 挂 
Wt) 。 请 查看 有 关 手 册 。 

ECHOE (c lflag, POSIX.1、 FreeBSD, Linux, Mac OS X, 
Solaris) 若 设置 并 且 也 设置 TICANON， 则 ERASE 字 符 从 显示 中 控 除 当前 
行 中 的 最 后 一 个 字符 。 这 通常 是 在 终端 驱动 程序 中 写 一 个 3 字符 序列 实 
现 的 ， 该 序列 是 : 退 格 、 空 格 、 退 格 。 若 支持 WERASE 字 符 ， 则 
ECHOE 用 一 个 或 若干 个 上 述 3 字 符 序 列 擦 除 前 一 个 字 。 若 支持 
ECHOPRT 标志 ， 则 这 里 说 明 的 关于 ECHOE 的 动作 是 在 假定 未 设置 
ECHOPRT 标 志 的 条 件 下 得 出 的 。 

ECHOK (c lflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 若 设 置 并 且 也 设置 ICANON， 则 KILL 字 符 从 显示 中 擦 除 当前 
行 ， 或 者 输出 NL 字符 (用 以 强调 已 擦 除 整 个 行 〉。 

若 支 持 ECHOKE 标 志 ， 则 关于 ECHOK 的 说 明 是 在 假定 未 设置 
ECHOKE 标 志 的 条 件 下 得 出 的 。 

ECHOKE (c lflag, FreeBSD, Linux, Mac OS X, Solaris) ix 
置 并 且 也 设置 ICANON， 则 回 显 KILL 字符 的 方式 是 擦 除 行 中 的 每 一 个 
字符 。 擦 除 每 个 字符 的 方法 则 由 ECHOE 和 ECHOPRT 标 志 选 择 。 

ECHONL (c lflag, POSIX.1、 FreeBSD. Linux, Mac OS X, 
Solaris) 若 设置 并 且 也 设置 TICANON， 即 使 没有 设置 ECHO， 也 回 显 NL 
字符 。 

ECHOPRT (c_lflag, FreeBSD. Linux. Mac OS X, Solaris) ix 
置 并 且 也 设置 ICANON 和 ECHO， 则 ERASE 字 符 〈 以 及 WERASE 字 符 ， 
Aa SL BSC) 使 所 有 正 被 探 除 的 字符 按 它 们 被 探 除 的 方式 被 打印 。 这 一 
方法 常 在 硬 拷贝 终端 上 显示 其 作用 ， 它 可 以 使 我 们 确切 地 看 到 哪些 字符 
正 被 删除 。 

EXTPROC (c_lflag, FreeBSD. Linux, Mac OS X) FA, yù 
字符 处 理 在 操作 系统 之 外 执行 。 如 果 串 行 通 信 外 设 卡 能 够 通过 执行 某 些 
行规 程 处 理 减 轻 主 机 处 理 器 负载 ， 那 么 就 可 以 这 样 设置 。 在 使 用 伪 终 端 
时 ( 见 第 19 章 ) ， 也 可 以 这 样 设置 。 

FFDLY (c_oflag, XSI, Linux, Solaris) 换 页 延迟 屏蔽 字 。 此 屏蔽 
字 标 志 值 是 FEF0 或 FF1。 

FLUSHO (c lflag, FreeBSD, Linux, Mac OS X, Solaris) Ai 
置 ， 则 冲洗 输出 。 当 键入 DISCARD 字符 时 设置 此 标志 。 当 键入 另 一 个 
DISCARD 字符 时 ， 此 标志 被 清除 。 可 以 通过 设置 或 清除 此 终端 标志 























设置 或 清除 此 条 件 。 

HUPCL (c_cflag, POSIX.1, FreeBSD. Linux. Mac OS X, 
Solaris) ERA. Wl) Sela PERE AN CY AE ara hR E 
至 低 电 平 〈 也 就 是 调制 解 调 器 的 连接 断 开 ) 。 

ICANON  (c_lflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) iE, WPT PE CWL18.1075) 。 这 使 下 列 字 符 起 作 
用 : EOF、EOL、EOL2、ERASE、KILL、REPRINT、STATUS 和 
WERASE。 输 入 字符 被 装配 成 行 。 

ICRNL (c iflag, POSIX.1、 FreeBSD, Linux. Mac OS X, 
Solaris) 若 设置 并 且 未 设置 IGNCR， 则 将 接收 到 的 CR 字符 转换 成 NL 字 
符 。 

IEXTEN (c lflag, POSIX.1. FreeBSD. Linux, Mac OS X, 
Solaris) 耕 设 置 ， 则 识别 并 人 处理 扩展 的 、 由 实现 定义 的 特殊 字符 。 

IGNBRK  (c iflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 在 已 设置 时 ， 忽 略 输入 中 的 BREAK 条 件 。 关 于 BREAK 条 件 是 
产生 SIGINT 信 号 还 是 被 作为 数据 读 取 ， 见 BRKINT。 

IGNCR (c_iflag, POSIX.1、 FreeBSD. Linux, Mac OS X, 
Solaris) 若 设 置 ， 则 忽略 接收 到 的 CR 字符 。 若 未 设置 此 标志 ， 而 设置 了 
ICRNL 标 志 ， 则 有 可 能 将 接收 到 的 CR 字符 转换 成 NL 字符 。 

IGNPAR  (c_iflag, POSIX.1、 FreeBSD. Linux, Mac OS X, 
Solaris) 在 已 设置 时 ， 忽 略 带 有 结构 出 错 ( 非 BREAK) 或 奇偶 出 错 的 输 
ATT. 

IMAXBEL (c_iflag, FreeBSD, Linux, Mac OS X, Solaris) 当 输 
ABS YES o 

INLCR (c_iflag, POSIX.1, FreeBSD, Linux. Mac OS X, 
Solaris) 大 设置 ， 则 将 接收 到 的 NL 字符 转换 成 CR 字符 。 

如 果 不 以 规范 模式 工作 ， 则 读 请 求 直 接 从 输入 队列 取 字 符 。 在 至 少 
接 到 MIN 个 字 节 或 两 个 字 市 之 间 的 超时 值 TIME 到 期 时 ，read 才 人 返回。 详 
细 情 况 参见 18.11 市 。 

INPCK  (c_iflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 在 已 设置 时 ， 使 输入 奇偶 校 验 起 作用 。 硅 未 设置 INPCK， 则 使 
输入 奇偶 校 验 不 起 作用 。 

奇偶 “产生 和 检测 * 和 “输入 奇偶 校 验 ”是 两 件 不 同 的 事 。 奇 偶 位 的 产 
生 和 检测 是 由 PARENB 标 志 控 制 的 。 设 置 该 标志 后 通常 会 使 串 行 接口 的 
设备 驱动 程序 对 输出 字符 产生 奇偶 位 ， 对 输入 字符 则 验证 其 奇偶 性 。 
PARODD 标志 决定 该 奇 侦 性 应 当 是 奇 还 是 个。 如果 一 个 其 奇偶 性 错误 
的 输入 字符 到 来 ， 则 检查 INPCK 标 志 的 状态 。 寿 已 设置 此 标志 ， 则 检查 

















IGNPAR 标 志 《 以 决定 是 否 应 忽略 带 奇 偶 出 错 的 输入 字 节 ) ANIA 
略 此 输入 字 节 ， 则 检查 PARMRK 标 志 以 决定 应 该 向 读 进程 传送 哪些 字 
符 。 

ISIG (c_lflag, POSIX.1, FreeBSD. Linux, Mac OS X, Solaris) 
GZA, A ASAE oe Fa ee BE Ama S PREF (INTR、 
QUIT. SUSP#IDSUSP) ; 在 是 ， 则 产生 相应 信和 号 。 

ISTRIP (c_iflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 在 已 设置 此 标志 时 ， 有 效 输 入 字 节 被 剥离 为 7 位 。 在 未 设置 
时 ， 则 处 理 全 部 8 位 。 

IUCLC (c_iflag, Linux, Solaris) 将 输入 的 大 写字 符 转 换 成 小 写字 
符 。 

IUTF8 (c_iflag, Linux, Mac OS X) 允许 使 用 UTF-8 多 字 节 字符 进 
行 字符 探 除 处 理 。 

IXANY (c_iflag, XSI, FreeBSD. Linux. Mac OS X, Solaris) 使 
任何 字符 都 能 重新 启动 输出 。 

IXOFF  (c iflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 若 设 置 ， 则 使 启动 -停止 输入 控制 起 作用 。 当 终端 驱动 程序 发 现 
输入 队列 将 要 填 满 时 ， 输 出 一 个 STOP 字 符 。 此 字符 应 当 由 发 送 数据 的 
设备 识别 ， 并 使 该 设备 停止 。 此 后 ， 当 把 输入 队列 中 的 字符 处 理 完毕 之 
后 ， 终 端 驱动 程序 将 输出 一 个 START 字 符 ， 使 该 设备 恢复 发 送 数据 。 

IXON (c_iflag, POSIX.1, FreeBSD, Linux. Mac OS X, 
Solaris) 知 设 置 ， 则 使 启动 -停止 输出 控制 起 作用 。 当 终端 驱动 程序 接收 
到 一 个 STOP 字 符 时 ， 输 出 停止 。 在 输出 停止 时 ， 下 一 个 START 字 符 恢 
复 输出 。 若 未 设置 此 标志 ， 则 START 和 STOP 字 符 由 进程 作为 一 般 字 符 
BEAR. 

MDMBUF (c_cflag, FreeBSD, Mac OS X) 按照 调制 解 调 器 的 载 
波 标志 进行 输出 流 控 制 。 这 是 CCAR_OFLOW 标 志 的 曾 用 名 。 

NLDLY (c_oflag, XSI. Linux. Solaris) 换行 延迟 屏蔽 字 。 此 屏 
蔽 字 的 值 是 NL0 或 NL1。 

NOFLSH (c lflag, POSIX.1、 FreeBSD, Linux, Mac OS X, 
Solaris) 按 系 统 默认 ， 当 终端 驱动 程序 产生 SIGINT 和 SIGQUIT 信和 号 
时 ， 输 入 和 输出 队列 都 被 冲洗 。 另 外 ， 当 它 产 生 SIGSUSP 信 号 时 ， 输 入 
队列 被 冲洗 。 若 已 设置 NOFLSH 标 志 ， 则 在 这 些 信号 产生 时 ， 不 对 输 
入 、 输 出 队列 进行 常规 冲洗 。 

NOKERNINFO (c lflag，FreeBSD、Mac OS X) 在 已 设置 时 ， 此 
标志 阻止 STATUS 字符 打印 前 台 进 程 组 的 信息 。 但 是 无 论 是 否 设置 此 标 
志 ，STATUS 字符 都 会 使 SIGINFO 信 和 号 被 发 送 至 前 台 进 程 组 。 

















OCRNL (c_oflag, XSI, FreeBSD. Linux, Solaris) FWA, WY 
输出 的 CR 字符 转换 成 NL 字符 。 

OFDEL ”(c_oflag，XSI、Linux、Solaris) 若 设置 ， 则 输出 填充 字 
符 是 ASCII DEL; 否则 是 ASCII NUL。 见 OFILL 标 志 。 

OFILL (c_oflag，XSI、Linux、Solaris〉 若 设置 ， 则 传递 填充 字符 
(ASCII DEL 或 ASCII NUL， 见 OFDEL 标 志 〉 以 实现 延迟 ， 而 不 使 用 时 
间 延 迟 。 见 6 个 延迟 屏蔽 字 标 志 : BSDLY、CRDLY、FFDLY、 
NLDLY、TABDLY 和 VTDLY。 

OLCUC (c_oflag, Linux, Solaris) 各 设 置 ， 则 将 小 写字 符 转 换 成 
大 写字 符 。 

NLCR (c oflag, XSI, FreeBSD, Linux, Mac OS X, Solaris) # 
设置 ， 将 输出 的 NL 字符 转换 成 CR-NL 字 符 。 

ONLRET (c_oflag, XSI, FreeBSD, Linux, Solaris) 车 设置 ， 则 
假定 输出 的 NL 字符 执行 回 车 功能 。 

ONOCR (c_oflag, XSI, FreeBSD, Linux, Solaris) 车 设置 ， 则 
在 0 列 不 输出 CR 字符 。 

ONOEOT (c_oflag, FreeBSD. Mac OS X) 若 设置 ， 则 在 输出 中 
丢弃 EOT (AD) 字符 。 在 某 些 将 Ctrl+D 解 释 为 挂 断 的 终端 上 ， 设 置 此 标 
志 可 能 是 必需 的 。 

OPOST (c_oflag, POSIX.1, FreeBSD, Linux, Mac OS X, 
Solaris) 知 设置 ， 则 进行 实现 定义 的 输出 处 理 。 关 于 c_oflag 字 段 的 各 种 
实现 定义 标志 ， 见 图 18-6。 

OXTABS (c_oflag, FreeBSD. Mac OS X) 若 设置 ， 则 制 表 符 在 
输出 中 被 扩展 为 空格 。 这 与 将 水 平 制 表 符 延迟 (TABDLY) 设置 为 
XTABS 或 TAB3 所 产生 的 效果 相同 。 

PARENB (c cflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 车 设置 ， 则 对 输出 字符 产生 奇偶 位 ， 对 输入 字符 执行 奇偶 校 
验 。 若 已 设置 PARODD， 则 奇 侦 校 验 是 奇 校 验 ， 否 则 是 侦 校 验 。 男 见 对 
INPCK、IGNPAR 和 PARMRK 标 志 的 讨论 。 

PAREXT (c_cflag, Solaris) 选择 标记 或 空 奇偶 性 。 知 PARODD 设 
置 ， 则 奇偶 位 总 是 1 《标记 奇偶 性 ) ; 否则 ， 奇 侦 位 总 是 0〈 空 奇偶 
PE) 。 

PARMRK (ciflag, POSIX.1、 FreeBSD. Linux. Mac OS X, 
Solaris) 在 已 设置 时 ， 若 未 设置 IGNPAR， 则 带 有 结构 出 错 〈 非 
BREAK) 的 字 节 或 带 有 奇偶 出 错 的 字 节 将 被 进程 读 作 一 个 3 字符 序列 
\377、\0 和 X， 其 中 X 是 接收 到 的 出 错字 节 。 和 若 未 设置 ISTRIP， 则 一 个 有 
效 的 \377 被 传送 给 进程 时 为 377，\377。 若 未 设置 IGNPAR 和 PARMRK， 


























则 带 有 结构 出 错误 或 奇偶 出 错 的 字 节 都 被 读 作 一 个 字符 \0。 

PARODD (c cflag, POSIX.1、 FreeBSD. Linux, Mac OS X, 
Solaris) 奉 设 置 ， 则 输出 和 输入 字符 的 奇 侦 性 都 是 奇 ， 否 则 为 俩 。 注 
意 ，PARENB 标志 控制 奇 侦 性 的 产生 和 检测 。 

PENDIN (c lflag, FreeBSD. Linux. Mac OS X, Solaris) 若 设 
置 ， 则 在 下 一 个 字符 输入 时 ， 尚 未 读 的 任何 输入 都 由 系统 重新 打印 。 这 
一 动作 与 键入 REPRINT 字 符 时 的 作用 相 类 似 。 

TABDLY (c_oflag, XSI, Linux. Mac OS X, Solaris) 水 平 制 表 
符 延 迟 屏蔽 字 。 此 屏蔽 字 的 值 是 TAB0、TAB1、TAB2 或 TAB3。 

在 已 设置 CMSPAR 或 PAREXT 标 志 时 ，PARODD 标 志 也 控制 是 否 使 
用 标记 或 空 奇偶 性 。 

XTABS 的 值 等 于 TAB3。 此 值 使 系统 将 制 表 符 扩 展 成 空格 。 系 统 
假定 制 表 符 的 长 度 为 8 个 空格 ， 不 能 更 改 此 假定 。 

TOSTOP (c lflag, POSIX.1, FreeBSD. Linux, Mac OS X, 
Solaris) 和 若 设置 ， 并 且 该 实现 支持 作业 控制 ， 则 将 信号 SIGTTOU F] 
试图 写 控制 终端 的 一 个 后 台 进 程 的 进程 组 。 按 默认 ， 此 信号 暂停 该 进程 
组 中 所 有 进程 。 如 果 写 控制 终端 的 后 人 台 进 程 忽略 或 阻塞 此 信号 ， 则 终端 
驱动 程序 不 产生 此 信号。 

VIDLY (c_oflag, XSI, Linux. Solaris) 垂直 制 表 延迟 屏蔽 字 。 
此 屏蔽 字 的 值 是 VT0 和 VT1。 

XCASE (c_lflag, Linux, Solaris) FRA, FHER E. 
ICANON， 则 终端 被 假定 为 只 支持 大 写字 符 ， 全 部 输入 转换 为 小 写字 
符 。 要 想 输入 一 个 大 写字 符 ， 要 在 其 前 面 加 一 个 反 斜 枉 。 与 之 类 似 ， 系 
统 输出 大 写字 符 时 ， 也 要 在 其 前 面 加 一 个 反 斜 本 。 (如 今 这 个 选项 标志 
已 弃 用 ， 因 为 只 支持 大 写字 符 的 终端 即使 不 是 全 部 ， 也 是 绝 大 部 分 都 已 
经 不 存在 了 。 ) 














18.6 stty 命 令 
上 节 说 明 的 所 有 选项 都 可 以 被 检查 和 更 改 :在 程序 中 用 tcgetattr 和 


tcsetattr PRA (118.40) 进行 检查 和 更 改 ; 在 命令 行 〈 或 shell 脚 本 ) 中 
用 stty(1) 命 令 进 行 检查 和 更 改 。 简 单 地 说 ，stty(1) 命 令 就 是 图 18-7 中 所 列 
的 前 6 个 函数 的 接口 。 如 果 以 -a 选项 执行 此 命令 ， 则 显示 终端 的 所 有 选 


项 : 


$ stty -a 

speed 9600 baud; 25 rows; 80 columns; 

lflags: icanon isig iexten echo echoe -echok echoke -echonl echoctl 
-echoprt -altwerase -noflsh -tostop -flusho pendin -nokerninfo 
-extproc 

iflags: -istrip icrnl -inlcr -igncr ixon -ixoff ixany imaxbel -ignbrk 
brkint -inpck -ignpar -parmrk 

oflags: opost onlcr -ocrnl -oxtabs -onocr -onlret 

cflags: cread cs8 -parenb -parodd hupcl -clocal -cstopb -crtscts 
-dsrflow -dtrflow -mdmbuf 

cchars: discard = ^O; dsusp = AY; eof = AD; eol = <undef>; 
eol2 = <undef>; erase = ^H; erase2 = 4?; intr = AC; kill = AU; 
Inext = ^V; min = 1; quit = ^; reprint = ^R; start = ^Q; 
status = ^T; stop = ^S; susp = ^Z; time = 0; werase = ^W; 

大 在 选项 名 前 有 一 个 连 字 符 ， 表 示 该 选项 禁用 。 最 后 4 行 显示 各 终 











端 特殊 字符 〈 见 18.3 节 ) 的 当前 设置 。 第 1 行 显示 当前 终端 窗口 的 行 数 
和 列 数 ，18.12 节 将 对 终端 窗口 大 小 进行 讨论 。 


stty 命 令 使 用 它 的 标准 输入 获得 和 设置 终端 的 选项 标志 。 虽 然 ， 某 


些 较 早 的 实现 使 用 标准 输出 ， 但 POSIX.1 要 求 使 用 标准 输入 。 本 书 讨论 
的 4 种 实现 提供 了 在 标准 输入 上 操作 的 stty 版 本 。 





这 意味 着 如 果 希 望 了 解 名 为 ttyla 的 终端 的 设置 ， 那 么 可 以 键入 
stty -a </dev/ttyla 


18.7 波 特 率 函数 


术语 波 特 率 (baud rate) 是 一 个 历史 沿用 的 术语 ， 现 在 它 指 的 
是 “位 / 秒 ”(bit per second) 。 虽 然 大 多 数 终端 设备 对 输入 和 输出 使 用 同 
一 波 特 率 ， 但 是 只 要 硬件 许可 ， 可 以 将 它们 设置 为 两 个 不 同 值 。 

#include <termios.h> 

speed_t cfgetispeed(const struct termios *termptr); 

speed_t cfgetospeed(const struct termios *termptr); 

两 个 函数 的 返回 值 : 波 特 率 值 
int cfsetispeed(struct termios *termptr, Speed_t speed); 

int cfsetospeed(struct termios *termptr, speed_t speed); 

PATS PRAIA: 各 成功 ， 返 回 0; 出 错 ， 返 回 -1 

两 个 cfget 函 数 的 返回 值 ， 以 及 两 个 cfset 函 数 的 Speed 参数 都 是 下 列 浓 
量 之 一 : B50、B75、B110、B134、B150、B200、B300、B600、 

B1200, B1800, B2400, B4800, B9600, B192002KB38400. `% StBO%€ 
示 “ 挂 断 ”。 在 调用 tcsetattr 时 ， 如 知 将 输出 波 特 率 指定 为 B0， 则 调制 解 
调 器 的 控制 线 就 不 再 起 作用 。 

大 多 数 系统 定义 了 男 外 的 波 特 率 值 ， 如 B57600 以 及 B115250。 

使 用 这 些 函 数 时 ， 必 须 认 识 到 输入 、 输 出 波 特 率 是 存储 在 设备 的 
termios 结 构 中 的 ， 如 图 18-8 所 示 。 在 调用 两 个 cfget 函 数 中 的 任意 一 个 之 
前 ， 要 先 用 tcgetattr 获 得 设备 的 termios 结 构 。 与 此 类 似 ， 在 调用 两 个 cfset 
函数 中 的 任意 一 个 之 后 ， 要 做 的 就 是 在 termios 结 构 中 设置 波 特 率 。 为 使 
这 种 更 改 影 响 到 设备 ， 应 当 调 用 tcsetattr 函 数 。 即 使 所 设置 的 两 个 波 特 率 
中 的 任意 一 个 出 错 ， 在 调用 tcsetattr 之 前 可 能 也 不 会 发 现 这 个 错误 。 

这 4 个 波 特 率 水 数 的 存在 使 应 用 程序 不 必 考 虑 具体 实现 在 termios 结 
构 中 表示 波 特 率 的 不 同方 法 。Linux 和 BSD 派 生 的 平台 趋向 于 存储 波 特 
率 的 数值 。〈 即 9 600 波 特 京 存储 成 值 9 600) ， 然 而 ，System V 派 生 的 
平台 《〈 如 Solaris) 趋 问 于 以 位 屏蔽 方式 编码 小 特 率 。 从 cfget 函 数 得 到 的 
速度 值 以 及 向 cfset 函 数 传送 的 速度 值 都 未 转换 ， 与 它们 存储 在 termios 结 
构 中 的 表示 形式 一 样 。 














18.8 行 控制 也 类 


下 列 4 个 函数 所 供 了 终端 设备 的 行 控制 能 力 。4 个 函数 部 要 求 参数 fd 


引用 一 个 终端 设备 ， 否 则 出 错 返 回 -1，errno 设 置 为 ENOTTY。 


#include <termios.h> 
int tcdrain(int fd); 
int tcflow(int fd, int action); 
int tcflush(int fd, int queue); 
int tcsendbreak(int fd, int duration); 
4 个 函数 的 返回 值 : 知 成 功 ， 返 回 0; 吞 出错， 返回 -1 
tcdrain 函数 等 待 所 有 输出 都 被 传递 。tcflow 函数 用 于 对 输入 和 输出 


流 控制 进行 控制 。action 参 数 必 定 是 下 列 4 个 值 之 一 。 


据 。 


TCOOFF 输出 被 挂 起 。 

TCOON 重新 启动 以 前 被 挂 起 的 输出 。 

TCIOFF 系统 发 送 一 个 STOP 字 符 ， 这 将 使 终端 设备 停止 发 送 数据 。 
TCION ”系统 发 送 一 个 START 字 符 ， 这 将 使 终端 设备 恢复 发 送 数 


tcflush K Bue CHOSE) 输入 缓冲 区 其 中 的 数据 是 终端 驱动 程序 








己 接收 到 ， 但 用 户 程 序 尚 未 读 取 的 ) 或 输出 缓冲 区 (其 中 的 数据 是 用 户 
程序 已 经 写 入 ， 但 尚未 被 传递 的 ) 。gqueue 参 数 必 定 是 下 列 3 个 常量 之 


TCIFLUSH 冲洗 输入 队列 。 

TCOFLUSH 冲洗 输出 队列 。 

TCIOFLUSH 冲洗 输入 队列 和 输出 队列 。 

tcsendbreak 函 数 在 一 个 指定 的 时 间 区 间 内 发 送 连续 的 0 值 位 流 。 和 若 


duration 参 数 为 0， 则 此 种 传递 延续 0.25 一 0.5 秒 。POSIX.1 说 明 若 duration 
非 0， 则 传递 时 间 依 赖 于 实现 。 


18.9 终 闹 标识 


历史 上 ， 在 大 多 数 UNIX 系 统 版 本 中 ， 控 制 终端 的 名 字 一 直 
是 /dev/tty。POSIX.1 提 供 了 一 个 运行 时 函数 ， 可 用 来 确定 控制 终端 的 名 
Fo 

#include <stdio.h> 

char *ctermid(char *ptr); 
返回 值 : ARJ, GRIP HAA RET; 车 出 错 ， 返 回 指 癌 空 字 

符 串 的 指针 

如 果 ptr 非 空 ， 则 被 认为 是 一 个 指针 ， 指 疝 长 度 人 至 少 为 L_ctermid F 
节 的 数组 ， 进 程 的 控制 终端 名 存储 在 该 数组 中 。 第 量 L_ctermid 被 定义 在 
<stdio.h> 中 。 寿 ptr 是 一 个 空 指针 ， 则 该 函数 为 数组 (通常 作为 静态 变 
量 ) 分 配 空间 。 同 样 ， 进 程 的 控制 终端 名 存储 在 该 数组 中 。 

在 这 两 种 情况 中 ， 该 数组 的 起 始 地 址 都 被 作为 函数 值 返回 。 因 为 大 
多 数 UNIX 系统 都 使 用 /dewtty 作 为 控制 终端 名 ， 所 以 此 函数 的 主要 作用 
是 改善 问 其 他 操作 系统 的 可 移植 性 。 

当 调 用 ctermid 函 数 时 ， 本 书 说 明 的 所 有 4 种 平台 都 返回 字符 
串 /dev/tty。 

实例 : ctermid 2 žr 

图 18-12 给 出 的 是 POSIX.1 ctermid 函 数 的 一 个 实现 。 


include <stdio.h> 
finclude <string.h> 


static char ctermid name[L ctermid]; 


char * 
ctermid(char *str) 


| 
if (str == NULL) 
str = ctermid name; 


return(strepy(str, "/dev/tty")); /* strcpy() returns str */ 


图 18-12 POSIX.1 ctermid 函 数 的 实现 
注意 ， 因 为 我 们 无 法 确定 调用 者 的 缓冲 区 大 小 ， 所 以 也 就 不 能 防止 
过 度 使 用 该 缓冲 区 。 
ee ee 如 
末 文 件 描述 符 引 用 一 个 终端 设备 ， 则 isatty 返 回 真 。ttyname 返 回 的 是 在 
该 文件 描述 符 上 打开 的 终端 设备 的 路 径 名 。 
#include <unistd.h> 
int isatty(int fd); 
返回 值 ， 葫 为 终端 设备 ， 返 回 1( 真 ); 和 否则， 返回 0〈 假 ) 
char *ttyname(int fd); 
返回 值 : 指 加 终端 路 径 名 的 指针 ;者 出 错 ， 返 回 NULL 
实例 : isatty 函 数 
如 图 18-13 所 示 ，isatty 函数 很 容易 实现 。 我 们 只 尝试 使 用 了 其 中 一 
Di 出 专用 函数 《如 果 成 功 执行 ， 它 不 改变 任何 东西 ) ， 并 查看 了 其 返 











#include <termios ,> 


int 
isatty(int fd) 
| 


struct termios ts; 


return(tcgetattr(fd, &ts) != -1); /* true if no error (is a tty) */ 


图 18-13 POSIX.1 isatty 函 数 的 实现 


使 用 图 18-14 中 的 程序 测试 isatty 函 数 。 


finclude "apue ,hn 


int 

main (void) 

| 

printf ("fd 0; s\n", isatty(0) ? "tty" ; "not a tty"); 
printf ("fd 1: s\n", isatty(1) ? "tty" : "not a tty"); 
printf("fd 2: s\n", isatty(2) ? "tty" t "not a tty"); 
exit (0); 





118-14 测试 isatty 函 数 
运行 图 18-14 中 的 程序 ， 得 到 如 下 输出 : 
$ ./a.out 
fd 0: tty 
fd 1: tty 
fd 2: tty 
$ ./a.out </etc/passwd 2>/dev/null 


fd 0: not a tty 

fd 1: tty 

fd 2: not a tty 

实例 : ttyname rk žr 

ttyname 函 数 〈 见 图 18-15) 比较 长 ， 因 为 它 要 搜索 所 有 设备 表 项 ， 
寻找 匹配 项 。 


#include <sys/stat.h> 


#include <dirent.h> 
#include <limits.h> 
#include <string.h> 
#include <termios.h> 
#include <unistd.h> 
#include <stdlib.h> 


struct devdir { 


struct devdir *d next; 
char *d_name; 
}; 
static struct devdir *head; 
static struct devdir *tail; 
static char pathname [_POSIX_PATH MAX + 1]; 


static void 

add(char *dirname) 

{ 
struct devdir *ddp; 
int len; 


len = strlen(dirname) ; 


/* 

* Skip ap «p and /dev/fd. 

y 

if ((dirname[len-1] == '.') && (dirname[len-2] == '/' 

(dirname [len-2] == '.' && dirname[len-3] == '/'))) 

return; 

if (strcmp (dirname, "/dev/fd") == 0) 
return; 

if ((ddp = malloc (sizeof (struct devdir))) == NULL) 
return; 

if ((ddp->d_name = strdup(dirname)) == NULL) { 
free (ddp) ; 
return; 


ddp->d_next = NULL; 


if (tail == NULL) { 
head = ddp; 
tail = ddp; 

} else { 
tail->d_next = ddp; 
tail = ddp; 


static void 
cleanup (void) 
{ 
struct devdir *ddp, *nddp; 


ddp = head; 

while (ddp != NULL) { 
nddp = ddp->d_next; 
free (ddp->d_name) ; 
free (ddp); 
ddp = nddp; 


a 
0) 
w 
Q 
| 


= NULL; 
= NULL; 


ct 
w 
H- 
H 
I 


Static char * 
searchdir(char *dirname, struct stat *fdstatp) 


{ 


struct stat devstat; 
DIR *dp; 

int devlen; 
struct dirent aug © Fs Ba oy 


strcpy (pathname, dirname); 

if ((dp = opendir(dirname)) == NULL) 
return (NULL); 

strcat (pathname, "/"); 

devlen = strlen(pathname) ; 

while ((dirp = readdir(dp)) != NULL) { 


strncpy (pathname + devlen, dirp->d_name, 


_POSIX_PATH MAX - devlen); 


/* 
* Skip aliases. 
EF 
if (strcmp (pathname, "/dev/stdin") == 
strcmp (pathname, "/dev/stdout") == 0 
strcmp (pathname, "/dev/stderr") == 0 
continue; 
if (stat (pathname, &devstat) < 0) 
continue; 


if (S_ISDIR(devstat.st_mode)) { 
add (pathname) ; 


continue; 
} 
if (devstat.st_ino == fdstatp->st_ino && 
devstat.st_dev == fdstatp->st_dev) { 


closedir (dp); 
return (pathname) ; 


closedir (dp); 
return (NULL) ; 


char 这 
ttyname(int fd) 
{ 


found a match */ 


struct stat fdstat; 
struct devdir  *ddp; 
char trval; 


if (isatty(fd) == 0) 
return (NULL) ; 

if (fstat(fd, &fdstat) < 0) 
return (NULL) ; 

if (S$ ISCHR(fdstat.st_mode) == 0) 
return (NULL) ; 


rval = searchdir("/dev", &fdstat) ; 
if (rval == NULL) { 
for (ddp = head; ddp != NULL; ddp = ddp->d_next) 
if ((rval = searchdir(ddp->d name, &fdstat)) != NULL) 
break; 


cleanup (); 
return (rval); 


图 18-15 POSIX.1 ttyname ei ACH SEAM, 

此 处 使 用 的 技术 是 恋 /dev 目 录 ， 寻 找 具 有 相同 设备 号 和 ij 节点 编号 的 
表 项 。 回 忆 4.24 节 ， 每 个 文件 系统 都 有 一 个 唯一 的 设备 号 〈stat ”结构 中 
的 st_dev 字段 ， 见 4.2 节 ) ， 文 件 系 统 中 的 每 个 目录 项 都 有 一 个 唯一 的 
i 节点 编号 〈stat 结构 中 的 stino 字段 ) 。 在 此 函数 中 ， 假 定 在 找到 一 个 
匹配 的 设备 号 和 匹配 的 诈 点 号 时 ， 就 能 找到 所 希望 的 目录 项 。 也 能 验 
证 这 两 个 表 项 与 st_rdev 字段 〈 终 端 设备 的 主 设备 号 和 次 设备 号 ) FADE 




















配 ， 还 能 验证 该 目录 项 是 一 个 字符 特殊 文件 。 但 是 ， 因 为 已 经 验证 了 文 
件 描述 符 参 数 既 是 一 个 终端 设备 ， 又 是 一 个 字符 特殊 文件 ， 而 且 因为 在 
UNIX 系 统 中 ， 匹 配 的 设备 号 和 ji 节点 编号 是 唯一 的 ， 所 以 不 再 需要 进行 
另外 的 比较 。 

终端 名 可 能 在 /dev 的 子 目 录 中 。 于 是 ， 需 要 搜索 /dev 下 的 整个 文件 
系统 树 。 我 们 跳 过 了 少数 几 个 可 能 会 产生 不 正确 结果 或 奇怪 结果 的 日 
录 : /dev/.、/dev/.. 和 /dev/fd。 我 们 也 跳 过 了 一 些 别 
名 : /dev/stdin、/dev/stdout 以 及 /dev/stderr， 因 为 它们 是 /dev/fd 目 录 中 文 
件 的 符号 链接 。 

使 用 图 18-16 中 的 程序 测试 这 一 实现 。 








finclude "apue.h" 


int 
main (void) 
| 
char *name; 
if (isatty(0)) { 
name = ttyname (0); 
if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


printf ("fd 0: ss\n", name); 


if (isatty(1)) { 
name = ttyname (1) ; 
if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


| 


printf ("fd 1: $s\n", name); 


if (isatty(2)) { 
name = ttyname (2); 
if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


printf ("fd 2: ss\n", name); 


exit (0); 


18-16 测试 tyname 函 数 
运行 图 18-16 中 的 程序 ， 得 到 ; 
$ ./a.out < /dev/console 2> /dev/null 
fd 0: /dev/console 
fd 1: /dev/ttys001 
fd 2: not a tty 


18.10 规范 模式 


规范 模式 很 简单 : 发 一 个 读 请 求 ， 当 一 行 已 经 输入 后 ， 终 端 驱 动 程 
序 即 返 回 。 以 下 几 个 条 件 造 成 读 返 回 。 

所 请 求 的 字 节 数 已 读 到 时 ， 读 返回 。 无 需 读 一 个 完整 的 行 。 如 果 
ee 那么 也 不 会 丢失 任何 信息 ， 下 一 次 读 从 前 一 次 读 的 停止 处 

Ho 

。 当 读 到 一 个 行 定 界 符 时 ， 读 返回 。 回 忆 18.3 节 ， 在 规范 模式 中 ， 
下 列 字 符 被 解释 为 “ 行 结束 ": NL、EOL、EOL2 和 EOF。 另 外 ， 在 18.5 
节 中 也 曾 说 明 ， 如 若 已 设置 TCRNL， 但 未 设置 TIGNCR， 则 CR 字符 的 作 
用 与 NL 字 符 一 样 ， 也 终止 一 行 。 

在 这 5 个 行 界 定 符 中 ， 只 有 一 个 EOF 符 在 终端 驱动 程序 对 其 进行 处 
其 他 4 个 字符 则 作为 其 所 处 行 的 最 后 一 个 字符 返回 给 调 











“如果 捕捉 到 信号 ， 并 且 该 函数 不 再 自动 重启 〈 见 10.5 节 ) ， 则 读 也 
返回 。 

实例 : getpass 函 数 

下 面 说 明 getpass 函 数 ， 它 读 入 用 户 在 终端 上 键入 的 口令 。 此 函数 由 
login(1) 和 crypt(1) 程 序 调用 。 为 了 读 取 口令 ， 该 函数 必须 关闭 回 显 ， 但 
仍 可 使 终端 以 规范 模式 进行 工作 ， 因 为 不 管 键 入 什么 作为 口令 都 能 构成 
一 个 完整 行 。 图 18-17 显 示 了 UNIX 系 统 中 的 一 个 典型 实现 。 


#include <signal.h> 


#include <stdio.h> 

#include <termios.h> 

#define MAX PASS LEN 8 /* max #chars for user to enter */ 
char * 


getpass(const char *prompt) 
{ 
static char buf [MAX_PASS LEN + 1]; /* null byte at end */ 
char Aptry 
sigset_t sig, osig; 
struct termios ts, ots; 
FILE Sipe 
int C; 


if ((fp = fopen(ctermid(NULL), "r+")) 
return (NULL) ; 
setbuf (fp, NULL); 


NULL) 


sigemptyset (&sig); 

sigaddset (&sig, SIGINT); /* block SIGINT */ 
sigaddset (&sig, SIGTSTP) ; /* block SIGTSTP */ 
sigprocmask (SIG BLOCK, &sig, &osig); /* and save mask */ 


tcgetattr (fileno (fp), &ts); /* save tty state */ 
ots = ts; /* structure copy */ 
ts.c lflag &= ~(ECHO | ECHOE | ECHOK | ECHONL); 
tcsetattr(fileno(fp), TCSAFLUSH, &ts); 

fputs (prompt, fp); 


ptr = buf; 
while ((c = getc(fp)) != EOF && c != '\n') 
if (ptr < &buf [MAX PASS LEN] ) 
*ptr++ = c; 
*ptr = 0; /* null terminate */ 
Pure NA", fp) /* we echo a newline */ 


tcsetattr(fileno(fp), TCSAFLUSH, &ots); /* restore TTY state */ 
sigprocmask (SIG SETMASK, &osig, NULL); /* restore mask */ 
fclose (fp); /* done with /dev/tty */ 

return (buf) ; 


图 18-17 getpass 函 数 的 实现 

在 此 例 中 ， 应 当 考 虑 以 下 几 个 方面 。 

“调用 ctermid 函 数 打 开 控 制 终端 ， 而 不 是 直接 将 /dewtty 写 在 程序 

“只 是 读 、 写 控制 终端 ， 如 果 不 能 以 读 、 写 模式 打开 此 设备 则 出 错 
返回 。 还 有 一 些 其 他 的 使 用 约定 。 在 GNU C 函 数 库 版 本 中 ， 如 果 不 能 以 
读 、 写 模式 打开 控制 终端 ， 则 getpass 读 取 标 准 输入 ， 写 到 标准 错误 。 在 
Solaris 厂 本 中 ， 如 果 不 能 打开 控制 终端 ， 则 getpass 失 败 。 

阻塞 两 个 信号 SIGINT 和 SIGTSTP。 如 果 不 这 样 做 ， 在 输入 INTR 字 
符 时 就 会 使 程序 异常 中 止 ， 并 使 终端 仍 处 于 禁止 回 显 状态 。 与 此 相 类 
似 ， 输 入 SUSP 字符 时 将 使 程序 停止 ， 并 且 在 禁止 回 显 状态 下 返回 到 
shell。 在 禁止 回 显 时 ， 我 们 选择 了 阻塞 这 两 个 信号 。 如 果 这 两 个 信号 是 
在 读 取 口令 期 间 产生 的 ， 则 它们 会 一 直 被 保持 ， 直 到 getpass 返 回 ， 阻 寨 
才 会 解除 。 也 有 其 他 方法 来 处 理 这 些 信 号 。 有 些 getpass 版 本 忽略 
SIGINT 〈 保 存 它 以 前 的 动作 ) ， 在 返回 前 将 其 动作 恢复 为 以 前 的 值 。 
这 就 意味 着 ， 在 该 信号 被 忽略 期 间 所 发 生 的 这 种 信号 都 会 丢失 。 其 他 版 
本 捕捉 SIGINT 〈 保 存 它 以 前 的 动作 ) ， 如 果 捕 捉 到 此 信和 号， 则 在 恢复 
终端 状态 和 信号 动作 后 ， 用 Kill 函数 发 送 此 信号 。 没 有 一 个 getpass 版 本 
捕捉 、 忽 略 或 阻塞 SIGQUIT， 所 以 输入 QUIT 字 符 束 会 使 程序 异常 中 
止 ， 并 且 很 可 能 使 终端 保持 在 禁止 回 显 状 态 。 

。 请 注意 ， 荣 些 shell， 尤 其 是 Korn shell， 在 以 交互 方式 读 输 入 时 都 
使 终端 处 于 回 显 状态 。 这 些 shell 是 提供 命令 行 编辑 的 shell， 因 此 在 每 次 
输入 一 条 交互 命令 时 都 处 理 终端 状 态 。 所 以 如 果 在 这 种 shell 下 调用 此 程 
序 ， 并 且 用 QUIT 字 符 使 其 异常 中 止 ， 则 这 种 shell 可 能 会 恢复 回 显 状 
态 。 其 他 不 提供 命令 行 编辑 的 shell (如 Bourne shel) 将 使 程序 异常 中 
止 ， 并 使 终端 保持 在 不 回 显 状态 。 如 果 对 终端 做 了 这 种 操作 ， 则 stty 命 
令 能 使 终端 恢复 到 回 显 状 态 。 

“使 用 标准 WO 读 、 写 控制 终端 。 我 们 特地 将 流 设 置 为 不 带 缓冲 的 ， 
否则 在 流 的 读 、 写 之 间 可 能 会 有 某 些 交 义 〈( 这 样 就 需要 多 次 调用 
fflush) 。 也 可 使 用 不 带 缓冲 的 VO COLES 3 章 ) ， 但 是 在 这 种 情况 下 就 
只 能 用 read 来 模仿 getc 函 数 。 

“最 多 只 存储 8 个 字符 作为 口令 。 输 入 的 其 他 多 余 字 符 则 全 部 被 名 


We 

图 18-18 中 的 程序 调用 getpass 并 且 打 印 我 们 输入 的 内 容 。 这 是 为 了 
验证 ERASE 和 KILL 字 符 能 否 正 常 工 作 〈 如 同 它 们 在 规范 模式 下 应 该 表 
现 的 那样 ) 。 





























#include "apue.h" 


char  *getpass(const char *); 


int 
main (void) 
| 
char = * ptr; 
if ((ptr = getpass ("Enter password:")) == NULL) 


err sys("getpass error"); 
printf ("password: %s\n", ptr); 


/* now use password (probably encrypt it) ... */ 


while (*ptr != 0) 
totrt = 0; /* zero it out when we're done with it */ 
exit (0) ; 


图 18-18 调用 getpass 函 数 
如 果 调 用 getpass 函数 的 程序 使 用 的 是 明文 口令 ， 那 么 为 了 安全 起 
见 ， 在 程序 完成 后 应 在 内 存 中 清除 它 。 如 果 该 程序 会 产生 其 他 用 户 可 能 
读 取 的 core 文 件 〈 回 忆 10.2 节 ，core 的 系统 默认 许可 权 使 每 个 用 户 都 能 读 
它 ) ， 或 者 如 果菜 个 其 他 进程 能 够 设法 读 该 进程 的 存储 空间 ， 则 它们 就 
可 能 会 读 到 这 个 明文 口令 。(“ 明 文 ” 是 指 我 们 在 getpass 打印 的 提示 符 
处 键入 的 口令 。 大 多 数 UNIX 系 统 程序 会 对 这 个 明文 口令 进行 修改 ， 将 
它 转换 成 一 个 “加 密 * 口 令 。 例 如 ， 口 令 文件 ( 见 6.2 节 〉 中 的 pw_passwd 
字段 包含 的 是 加 和 密 口 令 ， 而 不 是 明文 口令 。) 


18.11 HYLER 


可 以 通过 关闭 termios 结 构 中 c_jlflag 字 段 的 ICANON 标 志 来 指定 非 规 
范 模 式 。 在 非 规 范 模式 中 ， 输 入 数据 不 装配 成 行 ， 不 处 理 下 列 特殊 字符 
( 见 18.3 节 ) : ERASE, KILL, EOF, NL, EOL, EOL2, CR, 
REPRINT, STATUS#IWERASE. 

如 前 所 述 ， 规 范 模 式 很 容易 理解 : 系统 每 次 至 多 返回 一 行 。 但 在 非 
规范 模式 下 ， 系 统 如 何 知 道 在 什么 时 候 将 数据 返回 给 我 们 呢 ?” 如 果 它 一 
次 返回 一 个 字 节 ， 那 么 系统 开销 就 会 过 大 。【〔 回 忆 图 3-6， 从 中 可 以 看 
到 每 次 读 一 个 字 节 的 开销 有 多 大 。 如 果 每 次 返回 的 数据 加 倍 ， 那 么 系统 
调用 的 开销 就 可 以 减 半 。) 在 启动 读数 据 之 前 ， 往 往 不 知道 要 读 多 少数 
据 ， 所 以 系统 不 能 总 是 一 次 返回 多 个 字 节 。 

解决 方法 是 ， 当 已 读 了 指定 量 的 数据 后 ， 或 者 已 经 超过 了 给 定量 的 
时 间 后 ， 即 通知 系统 返回 。 这 种 技术 使 用 了 termios 结 构 中 c_cc 数 组 的 两 
个 变量 : MIN 和 TIME。c_cc 数 组 中 的 这 两 个 元 素 的 下 标 名 为 YMIN 和 和 
VTIME。 

MIN 指 定 一 个 read 返 回 前 的 最 小 字 节 数 。TIME 指 定 等 待 数据 到 达 的 
分 秒 数 ( 分 秒 为 秒 的 10， 。 有 下 列 4 种 情形 。 

情形 A: MIN>0，TIME>0 

TIME 指 定 一 个 字 节 间 定时 器 (interbyte timer) ， 它 只 在 第 一 个 字 
节 被 接收 时 启动 。 

在 该 定时 器 超时 之 前 ， 若 已 接 到 MIN 个 字 节 ， 则 read 返 回 MIN 个 字 
节 。 如 果 在 

接 到 MIN 个 字 节 之 前 ， 该 定时 器 已 超时 ， 则 read 返 回 已 接收 到 的 字 
a. (AWN 

时 器 是 在 第 一 个 字 节 被 接收 后 启动 的 ， 所 以 在 定时 器 超时 时 ，read 
至 少 会 返回 一 

个 字 节 。) 在 这 种 情形 中 ， 第 一 个 字 节 被 接收 之 前 ， 调 用 者 会 一 直 
阻塞 。 如 果 在 调 
r 用 read 时 数据 已 经 可 用 ， 则 就 如 同 在 read 后 数据 被 立即 接收 了 一 

情形 B: MIN>0, TIME==0 

read 在 接收 到 MIN 个 字 节 之 前 不 返回 。 这 会 造成 read 无 限期 阻塞 。 

情形 C: MIN==0, TIME>0 























TIME 指 定 一 个 调用 read 时 启动 的 读 定 时 器 。“〈 与 情形 A 相 比较 ， 两 
者 是 不 同 的 。 

在 情形 A 中 ， 非 0 TIME 表 示 字 节 间 定时 器 ， 该 定时 器 要 等 到 第 一 个 
字 节 被 接收 时 

才 启 动 。) 在 接 到 一 个 字 节 或 者 该 定时 器 超时 时 ，read 即 返回 。 如 
果 是 定时 器 超时 ， 

则 read 返 回 0。 

情形 D: MIN==0, TIME==0 

如 果 有 数据 可 用 ， 则 read 最 多 返回 所 要 求 的 字 节 数 。 如 果 无 数据 
可 用 ， 则 read 

立即 返回 0。 

在 所 有 这 些 情形 中 ，MIN 只 是 最 小 值 。 如 果 程 序 要 求 的 数据 多 于 
MIN 个 字 节 ， 那 么 它 或 许 能 接收 到 所 要 求 的 字 节 数 。 这 也 适用 于 
MIN==0 的 情形 C 和 情形 D。 

图 18-19 总 结 并 列 出 了 非 规 范 模 式 输入 的 4 种 不 同情 形 。 在 这 个 图 
中 ，nbytes 是 read 的 第 三 个 参数 (返回 的 最 大 字 节 数 )。 

















MIN>0 MIN==0 
As 在 定时 器 超时 前 ， C: FEN aay a, 
read J&IAl[MIN, nbytes); read J&|sl[1, nbytes); 
E MAEN EN, MAEN EN, 
read 退回 [1,MIN]， read 退回 0 
(TIME="F ili ie fr. (TIME=read 定 时 器 ,) 
凋 用 者 会 无 限期 阻塞 ,) 
B， 当 有 可 用 数据 时 ， D: read WENiIAl(0, nbytes). 
TIME == 0 read 退回 [MIN, nbytes). 
(调用 者 可 无 限期 阻塞 ,) 














图 18-19 非 规 范 输入 的 4 种 情形 

请 注意 ，POSIX.1 人 允许 下 标 VMIN 和 VTIME 的 值 分别 与 VEOF 和 
VEOL 的 相同 。 确 实 ，Solaris 就 是 这 样 做 的 ， 这 样 就 提供 了 与 System V 
的 早期 版 本 的 兼容 性 。 但 是 ， 这 也 带 来 了 可 移植 性 问题 。 从 非 规范 模式 
转换 为 规范 模式 时 ， 必 须 恢复 VEOF 和 VEOL。 如 果 VMIN 等 于 VEOF， 


且 不 恢复 它们 的 值 ， 那 么 当 把 VMIN 的 典型 值 设置 为 1 时 ， 文 件 结束 符 就 
变 成 了 Ctrlt+A。 解 决 这 一 问题 最 简单 的 方法 是 ， 在 要 转 入 非 规 范 模式 
Oe TOR yea ie 

KH 

图 18-20 中 的 程序 定义 了 函数 tty_cbreak 和 tty_raw， 它 们 将 终端 分 别 
设置 为 cbreak 模 式 (cbreak mode) 和 原始 模式 (raw mode). (术语 
cbreak 和 原始 来 自 于 V7 的 终端 驱动 程序 。〉 ”tty_reset 函 数 的 功能 是 将 终 
mK FI 原始 的 工作 状态 (也 就 是 调用 tty_cbreak 或 tty_raw 之 前 的 工作 
状态 ) 。 

如 果 已 调用 tty_cbreak， 那 么 在 调用  ttyraw ”之 前 需要 调用 
tty_reset。 如 果 已 调用 tty_raw， 然 后 又 要 调用 tty_cbreak， 那 么 在 此 之 前 
同样 也 要 调用 tty_reset。 这 减少 了 出 错时 终端 处 于 不 可 用 状态 的 机 会 。 

该 程序 还 提供 了 另外 两 个 函数 : tty_atexit 和 tty_termios。tty_atexit 可 
被 登记 为 退出 处 理 程序 ， 以 保证 exit 恢复 终端 工作 模式 。tty_termios 则 
返回 一 个 指 癌 原来 规范 模式 下 termios 结 构 的 指针 。 








#include "apue,hn 
Hinclude <termios.h> 
include <errno.h> 


static struct termios save termios; 
static int ttysavefd = -1; 
static enum { RESET, RAW, CBREAK } ttystate = RESET; 


int 
tty_cbreak(int fd)  /* put terminal into a cbreak mode */ 
| 

int err; 

struct termios buf; 


if (ttystate != RESET) { 
errno = EINVAL; 
return (-1); 


} 
if (tcgetattr(fd, &buf) < 0) 
return (-1) 37 


save_termios = buf; /* structure copy */ 
/* 

* Echo off, canonical mode off. 

Ey 


buf.c_lflag &= (ECHO | ICANON); 


sim 
* Case B: 1 byte at a time, no timer. 
xg 

Ba GC TVMIN] = Bs 

buf.c_cc[VTIME] = 0; 


if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 
return (-1); 


/* 
* Verify that the changes stuck. tcsetattr can return O on 
* partial success. 

Ey 
if (tegetattr(fd, ebuf) < 0) 4 
err = errno; 
tcsetattr(fd, TCSAFLUSH, &save_termios); 
errno = err; 
return (-1); 

} 
if (bufre: Jtlag © (ECHO |. TCANON)) | | .butecocce [VMIN] t= I |] 
butsc_ce[VTIME] “= 0) 4A 


{* 

* Only some of the changes were made. Restore the 
= Original setrings:. 

af 

tcsetattr (fd, TCSAFLUSH, &save_termios); 

errno = EINVAL; 

return (-1); 


ttystate = CBREAK; 
ttysavefd = fd; 
return (0); 


int 
tty_raw(int fd) /* put terminal into a raw mode */ 
{ 

int err; 

struct termios DUES 

if (ttystate != RESET) { 


errno = EINVAL; 
return (-1); 


} 
Le teegetaterttid, har) = 0) 


return (-1); 
save_termios = buf; 7/* structure copy */ 


ES 

* Echo off, canonical mode off, extended input 
* processing off, signal chars off. 

se 

buf.c_lflag &= ~(ECHO | ICANON | IEXTEN | ISIG); 


/* 

* No SIGINT on BREAK, CR-to-NL off, input parity 
* "eek pit, don't strip Sth bic: on input, output 
* flow control off. 


aA 
buf.c_iflag &= ~(BRKINT | TERNE | INPCK | ISTRIP | IXON); 
/* 

* Clear size bits, parity checking off. 
my 
buf.c_cflag &= ~(CSIZE | PARENB) ; 

/* 

= (Set 8 ib boy cha. 

a A 
but.c_cflag |= ‘CS8; 

/* 

* Output processing off. 

ia’ 

buf.c_oflag &= ~(OPOST); 

/* 

* Case B: 1 byte at a time, no timer. 
=f 

buf.c_cc[VMIN] = 1; 

buf.c_cc[VTIME] = Q? 


if (tcesetattr(fd, TCSAFLUSH, &buf) < 0) 
return (-1); 


/* 
* Verify that the changes stuck. tcsetattr can return O on 
* partial success. 
Sy 
LE Ctegetatertid, sbut) = BJ y 
err = errno; 
tesetattr(fd, TCSAFLUSH, &save_termios) ; 
errno = err; 


return (-1); 
} 
EE ((buft.c_lflag & (ECHO | ICANON | TEXTEN | ISIG)) || 
(buf.c_iflag & (BRKINT | ICRNL | INPCK | ISTRIP | IXON)) W 


(buf.c_cflag & (CSIZE | PARENB | CS8)) != css || 
(buf.c_oflag & OPOST) || buf.c_cc[VMIN] != 1 || 
bute Ge(VTIIME] = 0J f 


/* 


* Only some of the changes were made. Restore the 
* original settings. 

K 

tcsetattr (fd, TCSAFLUSH, &save_termios) ; 

errno = EINVAL; 

return (-1); 


ttystate = RAW; 
ttysavefd = fd; 
return (0); 


int 
tty_reset (int fd) /* restore terminal's mode */ 
{ 
if (ttystate == RESET) 
return (0); 
if (tcsetattr(fd, TCSAFLUSH, &save_termios) < 0) 
return (-1); 
ttystate = RESET; 
return (0) ; 


void 
tty_atexit (void) /* can be set up by atexit(tty_atexit) */ 
{ 
if (ttysavefd >= 0) 
tty_reset (ttysavefd) ; 


struct termios * 
tty_termios (void) /* let caller see original tty state */ 
{ 


return (&save termios); 





图 18-20 将 终端 模式 设置 为 cbreak 模 式 或 原始 模式 
cbreak 模 式 的 定义 如 下 。 

。 非 规范 模式 。 如 本 节 开 始 处 所 述 ， 这 种 模式 关闭 了 对 某 些 输入 字 
符 的 处 理 。 这 种 模式 没有 关闭 对 信号 的 处 理 ， 所 以 用 户 始终 可 以 键入 一 
个 能 够 触发 终端 产生 信号 的 字符 。 请 注意 ， 调 用 者 应 当 捕 捉 这 些 信号 ， 
否则 这 种 信号 就 有 可 能 终止 程序 ， 并 且 使 终端 保持 在 cbreak 模 式 。 

作为 一 般 规 则 ， 在 编写 更 改 终端 模式 的 程序 时 ， 应 当 捕 捉 大 多 数 信 
号 ， 以 便 在 程序 终止 前 恢复 终端 模式 。 

关闭 回 显 。 

每 次 输入 一 个 字 节 。 为 此 ， 将 MIN 设 置 为 1， 将 TIME 设 置 为 0。 这 
是 图 18-19 中 的 情形 B。 人 至 少 有 一 个 字 节 可 用 时 ，read 才 返回 。 

对 原始 模式 的 定义 如 下 。 

。 非 规范 模式 。 也 关闭 了 对 信号 产生 字符 ASIG) 和 扩充 输入 字符 
(IEXTEN) 的 处 理 。 

另外 还 禁用 了 BRKINT 字 符 ， 使 BREAK 字 符 不 再 产生 信号。 

关闭 回 显 。 

* 禁 上 上 输入 中 的 CR 到 NL 映射 (ICRNL)，、 输 入 奇偶 检测 
CINPCK) 、 剥 离 输 入 字 节 的 第 8 位 CISTRIP) 以 及 输出 流 控 制 
(IXON) . 

“8 位 字符 (CS8) ， 且 禁用 奇偶 校 验 (PARENB) 。 

禁止 所 有 输出 处 理 COPOST) 。 

每 次 输入 一 个 字 节 (MIN=1, TIME=0) 。 

图 18-21 中 的 程序 测试 原始 模式 和 cbreak 模 式 。 











#include "apue.h" 


static void 

sig_catch(int signo) 

{ 
printf ("signal caught\n") ; 
tty_reset (STDIN_FILENO) ; 
exit (0); 


int 

main (void) 

{ 
int is 
char CF 


if (signal(SIGINT, sig catch) == SIG ERR) /* catch signals */ 
err sys ("signal (SIGINT) error"); 

if (signal (SIGQUIT, sig_catch) == SIG ERR) 
err sys ("signal (SIGQUIT) error"); 

if (signal (SIGTERM, sig catch) == SIG ERR) 
err_sys("signal(SIGTERM) error"); 


if (tty raw(STDIN FILENO) < 0) 
err sys("tty_raw error"); 
printf ("Enter raw mode characters, terminate with DELETE\n"); 
while ((i = read(STDIN_FILENO, &c, 1)) == 1) { 
if ((c &= 255) == 0177) /* 0177 = ASCII DELETE */ 
break; 
print£("So\n", c); 
} 
if (tty reset (STDIN_FILENO) < 0) 
err _sys("tty_reset error"); 
if (i <= 0) 
err_sys ("read error"); 
if (tty_cbreak(STDIN_FILENO) < 0) 
err_sys("tty_cbreak error"); 
printf ("\nEnter cbreak mode characters, terminate with SIGINT\n") ; 
while ((i = read(STDIN FILENO, &c, 1)) == 1) { 
c &= 255; 
printf ("%o\n", BY 
} 
if (tty_reset (STDIN_FILENO) < 0) 


err_sys("tty_reset error"); 
if (i <= 0) 


err sys("read error"); 


exit (0); 














图 18-21 测试 原始 终端 模式 和 cbreak 终 端 模式 
运行 图 18-21 中 的 程序 ， 可 以 观察 这 两 种 终端 工作 模式 的 工作 情 











Dlo 

$ ./a.out 
Enter raw mode characters, terminate with DELETE 

4 

33 

133 

61 

70 

176 

键入 Delete 

Enter cbreak mode characters, terminate with SIGINT 
1 键入 Ctrl+A 
10 键入 退 格 
signal caught BEA UT BE 


在 原始 模式 中 ， 输 入 的 字符 是 Ctrl+D (04) 和 特殊 功能 键 F7。 在 所 
用 的 终端 上 ， 此 功能 键 产 生 5 个 字符 : ESC (033) ~ [ (0133) 、 
1 (061) 、8 (070) I~ (0176) 。 注 意 ， 在 原始 模式 下 关闭 了 输出 处 
理 COPOST) ， 所 以 在 每 个 字符 后 没有 得 到 回 车 符 。 另 外 还 要 注意 的 
是 ， 在 cbreak 模 式 下 ， 不 对 输入 特殊 字符 进行 处 理 〈 因 此 没 对 Ctrl+D、 
和 
理 。 

















18.12 终 闹 窗口 大 小 


大 多 数 UNIX 系 统 都 提供 了 一 种 跟踪 当前 终端 窗口 大 小 的 方法 ， 在 
窗口 大 小 发 生变 化 时 ， 使 内 核 通知 前 台 进 程 组 。 内 核 为 每 个 终端 和 伪 终 
端 都 维护 了 一 个 winsize 结 构 : 


struct winsize { 


unsigned short ws_row; /* rows, in characters */ 

unsigned short ws_col; /* columns, in characters */ 
unsigned short ws_xpixel; /* horizontal size, pixels (unused) */ 
unsigned short ws_ypixel; /* vertical size, pixels (unused) */ 


}; 

此 结构 的 规则 如 下 。 

“用 ioctl 〈 见 3.15 节 ) 的 TIOCGWINSZ 命 令 可 以 取 此 结构 的 当前 值 。 

“用 ioctl 的 TIOCSWINSZ 命令 可 以 将 此 结构 的 新 值 存储 到 内 核 中 。 
如 果 此 新 值 与 存储 在 内 核 中 的 当前 值 不 同 ， 则 前 台 进 程 组 会 收 到 
SIGWINCH 信 号 。 (注意 ， 从 图 10-1 中 可 以 看 出 ， 此 信号 的 系统 默认 动 
作 是 被 忽略 。) 

除了 存储 此 结构 的 当前 值 以 及 在 此 值 改变 时 产生 一 个 信号 以 外 ， 
内 核对 该 结构 不 进行 任何 其 他 操作 。 对 结构 中 的 值 进行 解释 完全 是 应 用 
程序 的 工作 。 

提供 这 种 功能 的 目的 是 ， 当 窗口 大 小 发 生变 化 时 应 用 程序 能 够 得 到 
通知 〈 如 vi 编辑 器 ) 。 应 用 程序 接收 此 信号 后 ， 可 以 获取 窗口 大 小 的 新 
值 ， 然 后 重 绘 屏 幕 。 

实例 

图 18-22 所 示 的 程序 打印 当前 窗口 大 小 ， 然 后 休眠 。 每 次 窗口 大 小 
改变 时 ， 程 序 就 捕捉 到 SIGWINCH 信 号 ， 然 后 打印 新 的 窗口 大 小 。 我 们 
必须 用 一 个 信号 终止 此 程序 。 








#include "apue.h" 
#include <termios.h> 
#ifndef TIOCGWINSZ 
#include <sys/ioctl.h> 
fendif 


static void 
pr_winsize(int fd) 
{ 


struct winsize size; 


if (ioctl (fd, TIOCGWINSZ, (char *) &size) < 0) 
err sys("TIOCGWINSZ error"); 
printf ("sd rows, %d columns\n", size.ws_row, size.ws col); 


static void 

sig winch(int signo) 

{ 
printf ("SIGWINCH received\n") ; 
pr_winsize (STDIN FILENO) ; 


int 
main (void) 
{ 
if (isatty(STDIN_FILENO) == 0) 
exit (1); 
if (signal (SIGWINCH, sig winch) == SIG ERR) 
err_sys("signal error"); 
pr_winsize (STDIN FILENO) ; /* print initial size */ 
tor {i 7) /* and sleep forever */ 
pause () ; 





图 18-22 打印 窗口 大 小 
主 一 个 带 窗 口 终端 的 系统 上 运行 图 18-22 中 的 程序 得 到 : 
$ ./a.out 





35 rows, 80 columns 初始 大 小 

SIGWINCH received 更 改 窗口 大 
: 捕捉 到 信号 

40 rows, 123 columns 

SIGWINCH received 再 一 次 

42 rows, 33 columns 

AC $ BEA HP Wr BE LA Ze 


18.13 termcap. terminfo*7!! curses 


termcap 的 意思 是 终端 能 力 (terminal capability) ， 它 涉及 文本 文 
件 /etc/termcap 和 一 套 读 此 文件 的 例 程 。termcap 这 种 搁 术 是 在 伯克利 开 
发 的 ， 注 意 是 为 了 支持 vi 编辑 器 。termcap 文 件 包 含 了 对 各 种 终端 的 说 
HH: 终端 文 持 哪些 功能 〈 如 行 数 、 列 数 、 终 端 是 否 文 持 退 格 ) ， 如 何 使 
终端 执行 某 些 操 作 《〈 如 清 屏 、 将 光标 移动 到 给 定位 置 ) 。 把 这 些 信 息 从 
编译 过 的 程序 中 取出 来 并 把 它们 放 在 易于 编辑 的 文本 文件 中 ， 这 样 就 使 
得 vi 编辑 器 能 在 很 多 不 同 的 终端 上 运行 。 

最 后 ， 将 文 持 termcap 文 件 的 例 程 从 vi 编辑 器 中 抽取 出 来 ， 放 在 一 个 
单独 的 curses 库 中 。 为 使 这 套 库 可 供 要 进行 屏幕 处 理 的 任何 程序 使 用 ， 
还 增加 了 很 多 功能 。 

termcap 这 种 技术 并 不 是 很 完善 。 当 越 来 越 多 的 终端 被 加 到 数据 文 
件 中 时 ， 为 找到 一 个 特定 的 终端 ， 需 要 花费 更 长 的 时 间 扫 摘 此 数据 文 
件 。 这 个 数据 文件 还 用 两 个 字符 的 名 字 来 标识 不 同 的 终端 属性 。 这 些 缺 
陷 迫 使 开发 人 员 开 发 出 了 terminfo 以 及 与 其 相关 的 curses 库 。 在 terminfo 
中 ， 终 端 说 明基 本 上 都 是 文本 说 明 的 编译 版 本 ， 在 运行 时 易于 被 快速 定 
位 。 terminfo 最初 由 SVR2 开 始 使 用 ， 此 后 所 有 System V 的 版 本 都 使 用 


‘Be 

历史 上 ， 基 于 System VAJZE Aterminfo, BSDIKAM Ate 
termcap， 但 是 现在 ， 系 统 通 常 两 者 都 提供 。 然 而 Mac OS X(t 
terminfo 。 

Goodheart[1991] 对 terminfo 和 curses 库 进行 了 详细 说 明 ， 但 此 书 已 不 
再 增 印 。Strang[1986] 说 明了 curses 函 数 库 的 伯克利 版 本 。Strang、Mui 和 
O:Reilly[1988] 则 对 termcap 和 terminfo 进 行 了 说 明 。 

可 在 http://invisible-island.net/ncurses/ncurses.html 或 http://www.gnu. 
org/software/ncurses 上 找到 与 SVR4 curses 接 口 兼 容 的 开放 版 ncurses 函 数 
库 


不 论 是 termcap 还 是 terminfo， 它 们 本 喘 都 不 处 理 本 章 所 述 及 的 问 
题 : 更 改 终端 的 模式 、 更 改 终端 特殊 字符 、 处 理 窗 口 大 小 等 。 它 们 所 提 
供 的 是 在 各 种 终端 上 执行 典型 操作 ( 清 屏 、 移 动 光 标 〉 的 方法 。 男 一 方 
面 ， 在 本 章 所 述 问题 方面 ，curses ”能 提供 某 种 具体 细节 方面 的 帮助 。 
curses 提 供 了 很 多 函数 ， 用 来 设置 原始 模式 、 设 置 cbreak 模 式 、 打 开 和 关 
HEEE. YER, curses 库 是 为 基于 字符 的 虹 终端 设计 的 ， 而 如 今 ， 它 


























们 大 部 分 已 被 以 基于 像素 的 图 形 终端 所 代 答 。 


18.14 小 结 


终 关 有 很 多 特征 和 选项 ， 其 中 大 多 数 都 可 按 需 进行 更 改 。 本 章 描 述 
了 很 多 更 改 终端 操作 〈 即 更 改 特殊 输入 字符 和 可 选择 标志 ) 的 函数 ， 还 
介绍 了 可 对 终 问 设备 进行 设置 或 恢复 的 各 个 终端 特殊 字符 以 及 众多 选 
项 。 











终端 的 输入 模式 有 两 种 一 规范 的 《每 次 一 行 ) 和 非 规范 的 。 本 章 中 
包含 了 若干 这 两 种 工作 模式 的 实例 ， 也 提供 了 一 些 函 数 ， 它 们 在 
POSIX.1 终 端 选项 和 较 早 的 BSD cbreak 模 式 及 原始 模式 之 间 进 行 映射 。 
本 章 还 说 明了 如 何 获取 和 改变 终端 窗口 大 小 。 





习题 


18.1 编写 一 个 调用 tty_raw 并 且 不 恢复 终端 模式 就 终止 的 程序 。 如 
果 系 统 提 供 reset(1) 命 令 〈( 本 书 说 明 的 4 种 平台 全 都 提供 ) ， 使 用 该 命令 
恢复 终端 模式 。 

18.2 c_cflag 字 段 的 PARODD 标 志 人 允许 我 们 设置 奇 检验 或 偶 校 验 ， 而 
BSD 中 的 tip 程 序 也 允许 奇偶 校 验 位 为 0 或 1。 它 是 如 何 实现 的 ? 

18.3 ”如 果 你 系统 中 的 stty(1) 命 令 输出 MIN 和 TIME 值 ， 做 下 面 的 练 
习 。 登 录 系 统 两 次 ， 其 中 一 次 登录 时 打开 vi 编辑 器 ， 在 另外 一 次 登录 中 
用 stty 命 令 确定 vi 设置 的 MIN 和 TIME 值 〈 因 为 vi 将 终端 设置 为 非 规范 模 
w) 。 “如果 你 的 终端 上 有 窗口 系统 正在 运行 ， 那 么 你 也 可 以 进行 同样 
的 测试 ， 方 法 是 : 登录 一 次 ， 然 后 用 两 个 分 开 的 窗口 。) 








19.1 引言 


在 第 9 章 中 ， 我 们 了 解 到 ， 终 端 登录 是 经 由 上 自动 提供 终端 语义 的 终 
问 设 备 进行 的 。 在 终端 和 运行 程序 之 间 有 一 个 终端 行规 程 〈 见 几 18- 

2) ， 通 过 该 规程 我 们 能 够 设置 终端 的 特殊 字符 〈 如 退 格 、 行 删除 、 中 
We) 。 但 是 ， 当 一 个 登录 请 求 到 达 网 络 连 接 时 ， 终 端 行规 程 并 不 是 自 
动 被 加 载 到 网 络 连接 和 登录 shell 之 间 的 。 图 9-5 显 示 了 一 个 伪 终 端 
(pseudo terminal) 设备 驱动 程序 ， 用 于 提供 终端 语义 。 

伪 终 端 除了 用 于 网 络 登录 ， 还 有 其 他 用 途 ， 本 章 将 对 此 进行 介绍 。 
首先 概要 投 述 如 何 使 用 伪 终 问 ， 接 着 讨论 某 些 特殊 使 用 情况 。 然 后 ， 提 
供 在 多 种 平台 下 用 于 创建 伪 终 端的 函数 ， 并 使 用 这 些 函 数 编写 一 个 程 
序 ， 我 们 将 该 程序 称 为 pty。 将 看 到 pty 程 序 的 各 种 用 途 : 抄录 在 终端 上 
输入 和 输出 的 所 有 字符 (script(1) 程 序 ) ; 运行 协同 进程 来 避免 图 15-19 
中 的 程序 过 到 的 缓冲 区 问题 。 

















19.2 概述 
伪 终 端 这 个 术语 是 指 ， 对 于 一 个 应 用 程序 它 看 上 去 像 一 个 终 
端 。 图 19-1 显示 了 使 用 伪 终 端 


端 ， 但 事实 上 它 并 不 是 一 个 真正 的 终端 
时 ， 相 关 进 程 的 典型 安排 。 图 中 的 关键 点 如 下 。 








fork。 子 进程 建立 


图 19-1 使 用 伪 终 端的 相关 进程 的 典型 结构 


“ 通 单 ， 一 个 进程 打开 伪 终 端 主 设备 ， 然 后 调用 
一 个 新 的 会 话 ， 打 开 一 个 相应 的 伪 终 端 从 设备 ， 将 其 文件 描述 符 复 制 到 


标准 输入 、 标 准 输出 和 标准 错误 ， 然 后 调用 exec。 伪 终端 从 设备 成 为 子 
进程 的 控制 终端 。 

“对 于 伪 终 端 从 设备 上 的 用 户 进程 来 说 ， 其 标准 输入 、 标 准 输出 和 
标准 错误 都 是 终 问 设备。 通过 这 些 描述 符 ， 用 户 进程 能 够 处 理 第 18 章 
中 的 所 有 终端 IO 函数 。 但 是 因为 伪 终 端 从 设备 不 是 真正 的 终端 设备 ， 
所 以 无 意义 的 函数 调用 《〈“ 例 如， 改变 波 特 率 、 发 送 中 断 符 、 设 置 奇偶 校 
验 ) 将 被 忽略 。 

“任何 写 到 伪 终 器 主 设备 的 都 会 作为 从 设备 的 输入 ， 反 之 亦 然 。 事 
实 上 ， 所 有 从 设备 端的 

输入 都 来 自 于 伪 终 端 主 设备 上 的 用 户 进程 。 这 看 起 来 就 像 一 个 双 辐 
但 从 设备 上 的 终端 行规 程 使 我 们 拥有 普通 管道 没有 的 其 他 处 理 能 











图 19-1 显 示 了 FreeBSD、Mac OS X 或 Linux 系 统 中 的 伪 终 端 结构 。 
19.3 节 将 介绍 如 何 打 开 这 些 设备 。 

在 Solaris 中 ， 伪 终端 是 使 用 STREAMS 子 系统 构建 的 〈 见 14.4 节 ) 。 
图 19-2 详 细 描 述 了 Solaris 中 各 个 伪 终 端 STREAMS 模 块 的 安排 。 虚 线 框 
中 的 两 个 STREAMS 模块 是 可 选 的 。pckt 和 ptem 模块 帮助 提供 伪 终 端 
特有 的 语义 。 另 外 两 个 模块 〈ldterm 和 ttcompat) 提供 行规 程 处 理 。 
19.3 节 将 展示 如 何 建立 这 些 STREAMS 模 块 的 安排 。 

现在 简化 以 上 图 示 ， 不 再 画 出 图 19-1 中 的 “ 读 函 数 和 写 函 数 ” 或 图 
19-2 中 的 “ 流 首 ”"。 同 时 使 用 缩写 “PTY”* 表 示 伪 终端 ， 并 将 图 19-2 中 所 有 
伪 终 端 从 设备 之 上 的 STREAMS 模块 合并 在 一 起 表示 为 “终端 行规 程 ? 模 
块 ， 像 图 19-1 中 的 那样 。 





stdin, stdout, stderr 
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图 19-2 Solaris 中 的 伪 终 端 安排 

现在 ， 我 们 来 考察 伪 终 端的 某 些 典型 用 途 。 

1. 网 络 登 录 服 务 右 

伪 终 端 可 用 于 构造 提供 网 络 登 录 的 服务 器 。 典 型 的 例子 是 tenetd 
和 rlogind 服务 器 。Stevens[1990] 中 的 第 15 章 详细 讨论 了 提供 rlogin 服 务 
的 步 又。 一 旦 登录 shell 运 行 在 远 端 主机 上 ， 即 可 得 到 图 19-3 中 所 示 的 安 
排 。telnetd 服 务 器 使 用 类 似 的 安排 。 

在 rlogind 服 务 器 和 登录 shell 之 间 有 两 个 exec 调 用 ， 这 是 因为 login 程 
序 通常 是 在 两 个 exec 之 间 检 验 用 户 是 否 合法 。 

图 19-3 的 一 个 关键 点 是 ， 驱 动 PTY 主 设备 的 进程 通常 同时 在 读 写 另 
一 个 WO 流 。 本 例 中 另 一 个 1/0 流 是 TCP/IP 框 。 这 表示 该 进程 必然 使 用 了 
某 种 形式 的 诸如 select 或 poll 这 样 的 HO 多 路 转 接 〈 见 14.4 节 ) ， 或 者 被 分 
成 两 个 进程 或 线程 。 

2. 窗口 系统 终端 模拟 

窗口 系统 通常 提供 一 个 终端 模拟 器 ， 这 样 我 们 就 能 在 熟悉 的 命令 行 
环境 中 通过 shell 来 运行 程序 。 终 问 模 拟 器 作为 shell 和 窗口 管理 器 之 间 
的 媒介 。 每 个 shell 在 自己 的 窗口 中 执行 。 这 个 安排 (两 个 shell 运 行 在 不 
同窗 口 ) 如 图 19-4 所 示 。 

shell 将 自己 的 标准 输入 、 标 准 输 出 、 标 准 错误 连接 到 PTY 的 从 设备 
端 。 终 端 模拟 器 程序 打开 PTY 的 主 设备 。 终 端 模拟 器 除了 作为 窗口 子 系 
统 的 接口 ， 还 要 负责 模拟 一 种 特殊 的 终端 ， 这 意味 着 它 需 要 根据 它 所 模 
拟 的 设备 类 型 来 啊 应 返回 码 。 这 些 码 列 在 termcap 和 terminfo 数 据 库 中 。 
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图 19-3 rlogind 服 务 器 的 进程 安排 
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图 19-4 窗口 系统 的 进程 安排 
当 用 户 改 变 终 端 模 拟 器 窗口 的 大 小 时 ， 窗 口 管理 器 会 通知 终端 模拟 
器 。 终 端 模 拟 器 在 PTY 的 主 设备 端 发 出 TIOCSWINSZ ioctl 命 令 来 设置 从 
设备 的 窗口 大 小 。 如 果 新 的 窗口 大 小 和 当前 的 不 同 ， 内 核 会 发 送 一 个 
SIGWINCH 信 号 给 前 台 PTY 从 设备 的 进程 组 。 如 果 应 用 程序 在 窗口 大 小 








改变 时 需要 重 绘 屏幕 ， 它 就 会 捕捉 这 个 SIGWINCH 信 号 ， 然 后 发 出 
TIOCSWINSZ ioctl 命 令 获 得 新 的 屏幕 尺寸 并 重 绘 屏幕 

3. script 程 序 

script(1) 程 序 是 随 大 多 数 UNIX 系统 提供 的 ， 它 将 终端 会 话 期 间 的 
所 有 输入 和 输出 信息 复制 到 一 个 文件 中 。 为 完成 此 工作 ， 该 程序 将 自己 


置 于 终端 和 一 个 新 调用 的 登录 shell 之 间 。 图 19-5 详 细 描述 了 script 程 序 有 
关 的 交互 。 这 里 要 特别 指出 ，script 程 序 通常 是 从 登录 shell 启 动 的 ， 该 
shell 还 要 等 待 script 程 序 的 终止 。 








图 19-5 script 程 序 


script 程 序 运行 时 ， 位 于 PTY 从 设备 上 的 终端 行规 程 的 所 有 输出 都 将 


复制 到 脚本 文件 中 (通常 称 为 typescript) 。 因 为 击 键 通常 由 该 行规 程 模 
块 回 显 ， 所 以 该 脚本 文件 也 包括 了 输入 的 内 容 。 但 是 ， 因 为 键入 的 口令 
不 会 回 显 ， 所 以 该 脚本 文件 不 会 包含 口令 。 

在 编写 本 书 第 1 版 时 ，Rich ”Stevens 用 script 程 序 获 取 实 例 程 序 的 输 
出 。 这 样 避 免 了 手工 复制 程序 输出 可 能 带 来 的 错误 。 但 是 ， 使 用 script 
的 不 足 之 处 是 必须 处 理 脚 本 文件 中 的 控制 字符 。 

在 19.5 节 开发 了 通用 的 pty 程 序 后， 我 们 将 看 到 使 用 pty 程 序 和 一 个 
简单 的 shell 脚 本 就 能 够 实现 一 个 新 版 本 的 script 程 序 。 

4. expect 程 序 

伪 终 问 可 以 用 来 在 非 交 互 模 式 中 驱动 交互 式 程序 的 运行 。 许 多 便 连 
线程 序 需 要 一 个 终端 才能 运行 ，passwd(1) 命 令 就 是 一 个 例子 ， 它 要 求 用 
户 在 系统 提示 后 输入 口令 。 

为 了 文 持 批 处 理 操作 模式 而 修改 所 有 交互 式 程序 是 非常 肪 烦 的 ， 与 
这 种 处 理 相 比 ， 一 个 更 好 的 解决 方法 是 通过 一 个 脚本 来 驱动 交互 式 程 
序 。expect 程 序 [Libes 1990，1991，1994] 提 供 了 这 样 的 方法 。 类 似 于 19.5 
节 的 pty 程 序 ， 它 使 用 伪 终 端 来 运行 其 他 程序 。 并 且 ，expect 还 提供 了 一 
种 编程 语言 用 于 检查 运行 程序 的 输出 ， 以 确定 用 什么 作为 输入 发 送 给 该 
程序 。 当 一 个 源 自 脚本 的 交互 式 的 程序 正在 运行 时 ， 不 能 仅仅 是 将 脚本 
中 的 所 有 内 容 复制 到 程序 中 去 ， 或 者 将 程序 的 输出 送 至 脚本 ， 而 是 必须 
要 辣 程 序 发 送 某 个 输入 ， 检 查 它 的 输出 ， 并 决定 下 一 步 发 送 给 程序 的 内 
容 


5. 运行 协同 进程 

在 图 15-19 所 示 的 协同 进程 的 例子 中 ， 我 们 不 能 调用 使 用 标准 IO 库 
进行 输入 、 输 出 的 协同 进程 ， 这 是 因为 当 通 过 管道 与 协同 进程 进行 通信 
时 ， 标 准 MVO 库 会 完全 缓冲 标准 输入 和 标准 输出 ， 从 而 引起 死 锁 。 如 果 
协同 进程 是 一 个 已 经 编译 的 程序 而 我 们 又 没有 源 程序 ， 则 无 法 在 源 程 序 
中 加 入 fflush 语 句 来 解决 这 个 问题 。 图 15-16 显 示 了 一 个 进程 驱动 协同 进 
程 的 情况 。 我 们 需要 做 的 是 将 一 个 伪 终 端 放 到 两 个 进程 之 间 《〈 如 图 19-6 
所 示 ) ， 诱 使 协同 进程 认为 它 是 由 终端 驱动 的 ， 而 非 另 一 个 进程 。 


协同 进程 

















































-一 和 | stdin 
驱动 程序 伪 终 端 
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图 19-6 用 盆 终 端 驱动 一 个 协同 进程 











现在 协同 进程 的 标准 输入 和 标准 输出 就 像 终端 设备 一 样 ， 所 以 标准 
IO 库 会 将 这 两 个 流 设 置 成 行 缓冲 。 

父 进 程 有 两 种 方法 在 上 自身 和 协同 进程 之 间 获 得 伪 终 端 。〈 这 种 情况 
下 的 父 进 程 可 以 类 似 图 15-18 中 的 程序 ， 使 用 两 个 管道 和 协同 进程 进行 
通信 。) 一 个 方法 是 ， 父 进程 直接 调用 pty_fork 函 数 〈 见 19.4 节 ) 而 不 是 
调用 fork。 男 一 种 方法 是 ，exec 访 pty 程序 ( 见 19.5 节 )〉 ， 将 协同 进程 作 
为 参数 。 我 们 将 在 给 出 pty 程 序 后 介绍 这 两 种 方法 。 

6. 观看 长 时 间 运 行程 序 的 输出 

使 用 任何 一 个 标准 shell， 可 以 将 一 个 需要 长 时 间 运 行 的 程序 放 到 后 
台 运 行 。 但 是 ， 如 果 将 该 程序 的 标准 输出 重 定 同 到 一 个 文件 ， 并 且 它 产 
生 的 输出 又 不 多 ， 那 么 我 们 就 不 能 方便 地 监控 程序 的 进展 ， 因 为 标准 
IO 库 将 完全 绥 冲 它 的 标准 输出 。 我 们 看 到 的 将 只 是 标准 MO 库 函 数 写 到 
输出 文件 中 的 成 块 输出 ， 有 时 甚至 可 能 是 长 度 为 8 192 字 节 的 数据 块 。 

如 果 有 源 程序 ， 则 可 以 加 入 乌 ush 调 用 强制 标准 IO 缓冲 区 在 某 些 节 
点 冲洗 或 者 把 缓冲 模式 改 成 使 用 setvbuf 的 行 缓冲 。 然 而 ， 如 果 没 有 源 程 
序 ， 可 以 在 pty 程 序 下 运行 该 程序 ， 让 标准 MO 库 认 为 标准 输出 是 终端 。 
图 19-7 显 示 了 这 个 安排 ， 我 们 将 这 个 绥 慢 输出 的 程序 称 为 Slowout。 从 登 
录 shell 到 pty 进 程 的 foryexec 箭 头 是 用 虚线 表示 的 ， 为 的 是 强调 pty 进 程 是 
作为 后 台 任 务 运行 的 。 











图 19-7 使 用 伪 终 端 运 行 一 个 缓慢 输出 的 程序 


19.3 为 终端 设 


PTY 表 现 得 就 像 物理 终端 设备 一 样 ， 因 此 应 用 程序 就 无 须 在 意 它 们 
在 使 用 的 是 何 种 设备 。 然 而 ， 在 打开 PTY 设 备 文件 时 ， 应 用 程序 并 不 需 
要 设置 O_TTY_INIT 标 识 。Single UNIX Specification 已 经 要 求 PTY 从 设 
备 端 第 一 次 被 打开 的 时 候 要 初始 化 ， 这 样 该 设备 正常 工作 所 需要 的 所 有 
非 标准 termios 标 识 就 都 被 设置 了 。 这 个 要 求 则 在 允许 PTY 设 备 和 遵循 
POSIX 的 调用 tcgetattr 和 tcsetattr 的 应 用 程序 正确 地 运行 。 

各 种 平台 打开 伪 终 端 设 备 的 方法 有 所 不 同 。 在 Single UNIX 
Specification 的 XSI 扩 展 中 包含 了 很 多 函数 ， 试 网 统一 这 些 方法 。 这 些 函 
数 的 基础 是 SVR4 用 于 管理 基于 STREAMS 的 伪 终 端的 一 组 函数 。 
ee 数 提 供 了 一 种 可 移植 的 方法 来 打开 下 一 个 可 用 伪 终 端 主 
设备 。 
#include <stdlib.h> 
#include <fcntl.h> 
int posix_openpt(int oflag); 
返回 值 : ARD, E FA H PTY E ti 4 SCE I FF a 

返回 -1 
参数 oflag 是 一 个 位 屏蔽 字 ， 指 定 如 何 打开 主 设 备 ， 它 类 似 于 open(2) 
的 oflag 参 数 ， 但 是 并 不 支持 所 有 打开 标志 。 对 于 posix_openpt， 可 以 指 
定 O_RDWR 来 打开 主 设 备 进行 读 、 写 ， 指 定 O_NOCTTY 来 防止 主 设备 
成 为 调用 者 的 控制 终端 。 其 他 打开 标志 都 会 导致 未 定义 的 行为 。 

在 伪 终 端 从 设备 可 用 之 前 ， 它 的 权限 必须 设置 ， 以 便 应 用 程序 可 以 
访问 它 。grantpt 函数 提供 这 样 的 功能 : 它 把 从 设备 节点 的 用 户 ID 设 置 为 
调用 者 的 实际 用 户 ID， 设 置 其 组 ID 为 一 非 指定 值 ， 通 常 是 可 以 访问 该 终 
端 设备 的 组 。 权 限 被 设置 为 : 对 个 体 所 有 者 是 读 / 写 ， 对 组 所 有 者 是 写 
(0620) 。 

实现 通常 将 PTY 从 设备 的 组 所 有 者 设置 为 ty 组 。 把 那些 要 对 系统 中 
所 有 活动 终端 具有 写 权限 的 程序 (如 wall(1) 和 write(1)〉 的 设置 组 ID 设 置 
为 ty 组 。 因 为 在 PTY 从 设备 上 tty 组 的 写 权 限 是 被 允许 的 ， 所 以 这 些 程序 
就 可 以 问 活 动 终端 写 入 。 

#include <stdlib.h> 

int grantpt(int fd); 

int unlockpt(int fd); 











两 个 函数 的 返回 值 ， 夺 成功， 返回 0; 徊 出错， 返回 -1 

为 了 更 改 从 设备 节点 的 权限 ，grantpt 可 能 需要 fork 并 exec 一 个 设置 
用 户 ID 程序 〈 如 在 Solaris 中 是 msvlib/pt_chmod) 。 于 是 ， 如 果 调 用 者 捕 
欣 到 SIGCHLD 信号 ， 那 么 其 行为 是 未 说 明 的 。 

unlockpt 函数 用 于 准予 对 伪 终 端 从 设备 的 访问 ， 从 而 允许 应 用 程序 
打开 该 设备 。 阻 止 其 他 进程 打开 从 设备 后 ， 建 并 该 设备 的 应 用 程序 有 机 
会 在 使 用 主 、 从 设备 之 前 正确 地 初始 化 这 些 设备 。 

注意 ， 在 grantpt 和 unlockpt 这 两 个 函数 中 ， 文 件 描述 符 参 数 是 与 伪 
终 疹 主 设备 关联 的 文件 描述 符 。 

如 果 给 定 了 伪 终 端 主 设备 的 文件 描述 符 ， 那 么 可 以 用 ptsname 函数 
找到 伪 终 端 从 设备 的 路 径 名 。 这 使 应 用 程序 可 以 独立 于 给 定 平台 的 某 种 
特定 约定 而 标识 从 设备 。 注 意 ， 该 函数 返回 的 名 字 可 能 存储 在 静态 存储 
中 ， 因 此 后 续 的 调用 可 能 会 履 善 它 。 

#include <stdlib.h> 

char *ptsname(int fd); 

返回 值 : 大 成 功 ， 返 回 指 网 PTY 从 设备 名 的 指针 ; 奋 出 错 ， 返 回 NULL 

图 19-8 总 结 了 Single UNIX Specification 中 的 伪 终 端 函数 ， 指 出 了 本 

书 讨论 的 4 种 平台 分 别 文 持 哪 些 函 数 。 





FreeBSD Linux MacOS Solaris 
320 X10.68 


grantpt 更 改 PTY 从 设备 的 权限 


posix_openpt | 打开 一 个 PTY 主 设备 
ptsname 返回 PTY 从 设备 的 名 字 
unlockpt 允许 打开 PTY 从 设备 


图 19-8 XSI 伪 终端 函数 

在 FreeBSD 中 ，grantpt 和 unlockpt 除 了 参数 验证 外 不 执行 任何 操作 ， 
PTY 是 通过 正确 的 权限 动态 地 创建 出 来 的 。 注 意 ，FreeBSD 定 义 
O_NOCTTY 标 志 只 是 为 了 兼容 调用 posix_openpt 的 应 用 程序 。 在 
FreeBSD 中 打开 终端 设备 并 不 会 引起 分 配 控 制 终端 的 副作用 ， 所 以 
O_NOCTTY 标 志 并 无 作用 。 

Single UNIX Specification 已 经 改善 了 此 方面 的 可 移植 性 ， 但 是 差距 
仍然 存在 。 我 们 提供 了 两 个 处 理 所 有 这 些 细节 的 函数 : ptym_open 和 














ptys_open。ptym_open 打 开 下 一 个 可 用 的 PTY 主 设备 ，ptys_open 打 开 相 
应 的 从 设备 。 
#include "apue.h" 
int ptym_open(char *pts_name, int pts_namesz); 
返回 值 ， 若 成 功 ， 返 回 PTY 主 设备 文件 描述 符 ， 若 出 错 ， 返 回 -1 
int ptys_open(char *pts_name); 
返回 值 : 知 成 功 ， 返 回 PTY 从 设备 文件 措 述 符 ; 知 出 错 ， 返 回 - 
通常 ， 不 直接 调用 这 两 个 函数 ， 而 是 由 函数 pty_fork A 19.4 节 ) 
调用 它们 ， 并 且 还 会 fork 出 一 个 子 进程 。 
ptym_open 函 数 打 开 下 一 个 可 用 的 PTY 主 设备 。 调 用 者 必须 分 配 一 
个 数组 来 存放 主 设备 或 从 设备 的 名 字 ， 并 且 如 果 调 用 成 功 ， 相 应 的 从 设 
备 名 会 通过 pts_name 返 回 。 然 后 ， 这 个 名 字 传 给 用 来 打开 该 从 设备 的 
ptys_open 函 数 。 组 冲 区 的 字 节 长 度 由 pts_namesz 传 送 ， 使 得 ptym_open 
函数 不 会 复制 比 该 缓冲 区 长 的 字符 串 。 
在 说 明 pty_fork 函 数 之 后 ， 提 供 两 个 函数 来 打开 这 两 个 设备 的 原 
将 会 很 明显 。 通 常 ， 一 个 进程 调用 ptym_open 来 打开 一 个 主 设备 并 且 得 
到 从 设备 名 。 该 进程 然后 fork 子 进程 ， 子 进程 在 调用 setsid 建 立新 的 会 话 
后 调用 ptys_open 打 开 从 设备 。 这 就 是 从 设备 如 何 成 为 子 进程 控制 终端 的 
过 程 〈 见 图 19-9) 。 
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#include "apue.h" 
#include <errno.h> 
#include <fcntl.h> 
#if defined (SOLARIS) 
#include <stropts.h> 
fendi f 





int 
ptym_open(char *pts_name, 


{ 


char pk oO r 

int fdm, err; 

if ((fdm = posix_openpt (O_ 
return (-1); 

if “grantpt ¢fdm) < 0} 
Goto Brno 

if (unlockpt (fdm < QO) 
goto errout; 

if ((ptr = ptsname (fdm) ) 
goto errout; 

rE 


* Return name of slave. 
* case where strlen (ptr) 
K 

strncpy (pts_name, ptr, 


pts_name[pts_namesz 


pts 
LJ 


return (fdm) ; 
errout: 


err errno; 
close (fdm) ; 

errno 
return (-1)-; 


Serr, 


TRE 
ptys_open (char *pts_name) 
{ 


tnt Edesy 
#if defined (SOLARIS) 
int err, setup; 
#endif 
if ((fds = open(pts_name, 


return (—1) z 


#if defined(SOLARIS) 


int pts_namesz) 


RDWR)) =< O) 
/* grant 
/* clear 
== NULL) 


Null terminate 
> pts_namesz. 


_namesz); 
"NO TG 
/* return 
O_RDWR)) < 0) 


access to slave */ 


slave's lock flag */ 


/* get slave's name */ 


to handle 


fd of master */ 


* Check if stream is already set up by autopush facility. 


/* 
a 
if ((setup = ioctl(fds, I_ 
goto errout; 
if (setup == 0) { 
if (torctléites; L PUSH; 
goto errout; 
LE CPOCEL (EAS, T PUSH; 
goto errout; 
Le {aaesthtfes, T BEUSHy 
errout: 


err SrCrr rno: 


FIND; “Ldatexrm™ 


"ptem" ) 


a. (OR 


"ldterm") 


"onsale 


< 


J} <s OD 


<= BY 


close (fds); 


errno = err; 
return(-1); 
} 
tendif 
return (fds) ; 


图 19-9 伪 终 端 打开 函数 

ptym_open 函 数 用 XSI PTY 函数 找 到 并 打开 一 个 未 被 使 用 的 PTY 主 设 
备 ， 并 初始 化 对 应 的 PTY 从 设备 。ptys_open 函 数 打开 的 是 PTY 从 设备 。 
然而 在 Solaris 系 统 中 ， 在 PTY 从 设备 表现 得 像 个 终端 前 ， 我 们 可 能 需要 
多 做 几 步 工作 。 

在 Solaris 中 ， 打 开 从 设备 后 ， 我 们 可 能 需要 将 3 个 STREAMS 模 块 压 
入 从 设备 的 流 中 。 伪 终端 仿真 模块 (ptem) 和 终端 行规 程 模块 
(ldterm) 合 在 一 起 像 一 个 真正 的 终端 一 样 工 作 。ttcompat 提 供 了 对 早期 
系统 (如 V7、4BSD 和 Xenix〉 的 ioctl 调 用 的 兼容 性 。 这 是 一 个 可 选 的 模 
块 ， 但 是 因为 对 于 网 络 登录 ， 它 是 上 自动 压 入 的 ， 所 以 我 们 将 它 压 入 到 从 
设备 的 流 中 。 

也 可 能 并 不 需要 压 入 这 3 个 模块 ， 其 原因 是 ， 它 们 可 能 已 经 位 于 流 
中 。STREAMS 系 统 支持 一 种 称 为 autopush 〈 自 动 压 入 ) 的 工具 ， 它 允 
许 系统 管理 员 配 置 一 张 模 块 列 表 ， 只 要 打开 一 个 特定 设备 ， 就 将 这 些 模 
块 压 入 流 中 《〈 详 见 Rago[1993]) 。 使 用 L_FIND ioctl 命 令 观察 ldterm 是 人 否 
己 在 流 中 。 如 果 是 ， 则 认为 该 流 已 用 autopush 机 制 配置 ， 这 样 束 无 需 再 
压 入 相应 模块 。 

Linux, Mac OS X 和 Solaris 都 遭 循 历史 上 System V 的 行为 : 如 果 调 
用 者 是 一 个 还 没有 控制 终端 的 会 话 首 进程 ， 这 个 打开 〈open) 的 调用 会 
分 配 一 个 PTY 从 设备 作为 控制 终端 。 如 果 不 想 让 这 种 情况 发 生 ， 可 以 在 
FTIF Copen) 时 设置 O0 NOCTTY 标 志 。 然 而 ， 在 FreeBSD 中 ， 打 开 PTY 
从 设备 不 会 产生 分 配 其 作为 控制 终端 的 副作用 ， 下 一 节 将 探讨 如 何在 
FreeBSD 中 分 配 控制 终端 。 








19.4 是 数 pty_fork 


现在 使 用 上 一 节 介 绍 的 两 个 函数 ptym_open 和 ptys_open 来 编写 一 个 


新 函数 ， 我 们 称 之 为 pty_fork。 这 个 新 函数 具有 如 下 功能 :用 fork 调 用 打 
开 主 设备 和 从 设备 ， 创 建 作为 会 话 首 进程 的 子 进程 并 使 其 具有 控制 终 


Tit o 


WR 


中 。 





#include "apue.h" 

#include <termios.h> 

pid_t pty_fork(int *ptrfdm, char *slave_name, int slave_namesz, 
const struct termios *slave_termios, 
const struct winsize *slave_winsize); 


器 值 ， 子 进程 中 返回 0; 父 进程 中 返回 子 进程 的 进程 ID; Arita, i 


回 -1 
PTY 主 设备 的 文件 描述 符 通 过 ptrfdm 指 针 返 回 。 
如 果 slave_name 不 为 空 ， 从 设备 名 被 存储 在 该 指针 指 同 的 存储 区 
调用 者 必须 为 该 存储 区 分 配 空间 。 
如 果 指 针 slave_termios 不 为 空 ， 则 系统 使 用 该 指针 所 引用 的 结构 初 





始 化 从 设备 的 终端 行规 程 。 如 果 该 指针 为 空 ， 那 么 系统 将 会 把 从 设备 的 
termios 结 构 设 置 成 实现 定义 的 初始 状态 。 类 似 地 ， 如 果 slave_winsize 指 
针 不 为 衬 ， 那 么 按 该 指针 所 引用 的 结构 初始 化 从 设备 的 窗口 大 小 。 如 果 
该 指针 为 空 ，winsize 结 构 通 种 被 初始 化 为 0。 


图 19-10 显 示 了 该 函数 的 代码 。 它 调用 相应 的 ptym_open 和 ptys_open 


妆 数 ， 在 本 书 讨 论 的 4 种 平台 上 ，pty_fork 函 数 都 能 工作 。 


#include "apue.h" 
#include <termios.h> 


pid -t 

pty_fork(int *ptrfdm, char *slave_name, int slave_namesz, 
const struct termios *slave_termios, 
const struct winsize *slave_winsize) 


int fdm, fds; 
pid_t pid; 
char pts_name [20]; 


if ((fdm = ptym_open(pts_name, sizeof(pts_name))) < 0) 
err_sys("can't open master pty: %s, error %d", pts_name, fdm); 


if (slave_name != NULL) { 
/* 
* Return name of slave. Null terminate to handle case 
* where strlen(pts_name) > slave_namesz. 


s/f 
strncpy(slave_name, pts_name, slave_namesz) ; 
slave name[slave namesz - 1] = '\0'; 


if ((pid = fork()) < 0) { 
return (-1); 
} else if (pid == 0) { /* child */ 
if (setsid() < 0) 
err sys("setsid error"); 


/* 
* System V acquires controlling terminal on open(). 
*/ 
if ((fds = ptys_open(pts_name)) < 0) 
err_sys ("can't open slave pty"); 
close (fdm) ; /* all done with master in child */ 


#if defined(BSD) 
/* 
* TIOCSCTTY is the BSD way to acquire a controlling terminal. 
zy 
if (ioctl(fds, TIOCSCTTY, (char *)0) < 0) 
err_sys("TIOCSCTTY error") ; 
#endif 
/* 
* Set slave's termios and window size. 
Ey 
if (slave termios != NULL) { 
if (tcsetattr (fds, TCSANOW, slave_termios) < 0) 


err_sys("tcsetattr error on slave pty"); 
if (slave winsize != NULL) { 
if (ioctl (fds, TIOCSWINSZ, slave winsize) < 0) 
err sys("TIOCSWINSZ error on slave pty"); 


/* 
* Slave becomes stdin/stdout/stderr of child, 
多 
if (dup2 (fds, STDIN FILENO) != STDIN FILENO) 
err sys ("dup2 error to stdin"); 
if (dup2 (fds, STDOUT FILENO) != STDOUT FILENO) 
err sys ("dup2 error to stdout"); 
if (dup2(fds, STDERR FILENO) != STDERR FILENO) 
err sys("dup2 error to stderr"); 
if (fds != STDIN FILENO && fds != STDOUT FILENO && 
fds != STDERR FILENO) 
close (fds) ; 


return (0); /* child returns 0 just like fork() */ 
} else | /* parent */ 

xptrfdm = fdm  /* return fd of master */ 

return (pid) ; /* parent returns pid of child */ 


图 19-10 pty_forkP žk 


在 打开 PTY 主 设备 后 ， 调 用 fork。 正 如 前 面 提 到 的 ， 子 进程 先 调 用 


setsid 建 立新 的 会 话 ， 然 后 才 调 用 ptys_open。 当 调用 setsid 时 ， 子 进程 还 
不 是 一 个 进程 组 的 首 进程 ， 因 此 执行 9.5 节 中 列 出 的 3 个 操作 步骤 : a) 
子 进 程 创 建 一 个 新 的 会 话 ， 它 是 该 会 话 的 首 进 程 ; (b) 子 进程 创建 一 
个 新 的 进程 组 Cc) 子 进程 断 开 与 以 前 可 能 有 的 控制 终端 的 关联 ， 于 
是 不 再 有 控制 终端 。 在 Linux、Mac OS “X 和 Solaris 系 统 中 ， 当 调用 
ptys_open 时 ， 从 设备 成 为 新 会 话 的 控制 终端 。 在 FreeBSD 系 统 中 ， 必 须 
调用 TIOCSCTTY ioct 来 分 配 一 个 控制 终端 。 (回想 图 9-8， 其 他 3 个 平 
台 也 支持 TIOCSCTTY ioctl 命 令 ， 但 是 只 有 在 FreeBSD 中 需要 我 们 去 调 
i 

termios 和 winsize 这 两 个 结构 在 子 进 程 中 初始 化 。 最 后 从 设备 的 文件 
描述 符 被 复制 到 子 进程 的 标准 输入 、 标 准 输出 和 标准 错误 中 。 这 意味 着 
不 管子 进程 以 后 调用 exec 执 行 何 种 程序 ， 它 都 具有 同 PTY 从 设备 〈 其 控 
制 终端 ) 联系 起 来 的 上 述 3 个 描述 符 。 

在 调用 fork 后 ， 父 进程 返回 PTY 主 设备 的 描述 符 以 及 子 进程 的 进程 
ID。 下 一 节 将 在 pty 程 序 中 使 用 pty_fork 函 数 。 

















19.5 pty 程 序 


编写 pty 程 序 的 目的 是 用 
pty prog argl arg2 
HA 


prog arg1 arg2 

当 用 pty 来 执行 为 一 个 程序 时 ， 那 个 程序 在 一 个 它 上 自己 的 会 话 中 执 
行 ， 并 和 一 个 伪 终 端 连接 。 

让 我 们 碍 看 pty 程 序 的 源 代 码 。 第 一 个 文件 〈 见 图 19-11) 包含 main 
图 数 。 它 调用 上 一 节 的 pty_fork 函 数 。 


#include "apue.h" 
#include <termios.h> 


#ifdef LINUX 


#define OPTSTR "+d:einv" 


#felse 


#define OPTSTR "d:einv" 


#endif 
static void 
void 


void 


int 


set_noecho (int) ; /* at the end of this file */ 
do_driver(char *); /* in the file driver.c */ 
loop(int, int); /* in the file loop.c */ 


main(int argc, char *argv[]) 


{ 


int fdm, c, ignoreeof, interactive, noecho, verbose; 
pid_t pid; 
char *driver; 
char slave _name[20]; 
struct termios orig_termios; 
struct winsize size; 
interactive = isatty(STDIN_FILENO) ; 
ignoreeof = 0; 
noecho = 0; 
verbose = 0; 
driver = NULL; 
opterr = 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt(argc, argv, OPTSTR)) != EOF) { 
switch (c) { 
case; ‘dts /* driver for stdin/stdout */ 
driver = optarg; 
break; 
case 'e': /* noecho for slave pty's line discipline */ 
noecho = 1; 
break; 
Case: rit /* ignore EOF on standard input */ 
ignoreeof = 1; 
break; 
case 'n': /* not interactive */ 


interactive = 0; 
break; 


case "y's /* verbose */ 


verbose = 1; 


break; 


case; "pre 
err quit ("unrecognized option: -%c", optopt); 


if (optind >= argc) 
err_quit("usage: pty [ =d driver -einv ] program [ arg ... ]"); 


if (interactive) { /* fetch current termios and window size */ 
if (tcgetattr (STDIN FILENO, &0rig_termios) < 0) 
err sys ("tcgetattr error on stdin"); 
if (ioctl (STDIN FILENO, TIOCGWINSZ, (char *) &size) < 0) 
err_sys ("TIOCGWINSZ error"); 


pid = pty_fork(&fdm, slave name, sizeof(slave_name), 
&0rig_termios, &size); 
} else I 
pid = pty _fork(&fdm, slave_name, sizeof(slave_name), 


NULL, NULL); 


it (pad <= 0) +f 
err_sys (“fork error"); 
} else if (pid == 0) { Jx Ghrla *¥ 
if (noecho) 
set_noecho(STDIN_FILENO); /* stdin is slave pty */ 


if (execvp(argv[optind], &argv[optind]) < 0) 
err_sys("can't execute: %s", argv[optind]); 


if (verbose) { 


fprintf(stderr, "slave name = %s\n", slave_name); 
if (driver != NULL) 
fprintf(stderr, “driver = s\n", driver); 
} 
if (interactive && driver == NULL) { 


if (tty_raw(STDIN_FILENO) < 0) /* user's tty to raw mode */ 
err sys ("tty raw error"); 

if (atexit(tty_atexit) < 0) /* reset user's tty on exit */ 
err _sys("atexit error"); 


if (driver) 


do driver (driver); /* changes our stdin/stdout */ 
loop(fdm, ignoreeof); /* copies stdin -> ptym, ptym => stdout */ 
exit(0); 


static void 
set_noecho(int fd) /* turn off echo (for slave pty) */ 
{ 


struct termios  stermios: 


1f (tcgetattr (fd, &stermios) < 0) 
err sys("tcgetattr error"); 


stermios.c_lflag &= ~(ECHO | ECHOE | ECHOK | ECHONL); 


/+ 
* Also turn off NL to CR/NL mapping on output. 
k 

stermios.c_oflag &= ~(ONLCR); 


if (tcsetattr(fd, TCSANOW, &stermios) < 0) 
err_sys("tcsetattr error"); 


图 19-11 pty 程 序 的 main 函 数 

下 一 节 介 绍 pty 程 序 的 不 同 用 途 时 ， 将 看 到 多 种 命令 行 选 项 。getopt 
函数 帮助 我 们 以 协调 一 致 的 模式 分 析 命 令 行 参 数 。 为 了 在 Linux 系 统 中 
强制 POSIX 行 为 ， 我 们 将 选项 字符 串 的 第 一 个 字符 设置 为 加 号 。 

在 调用 pty_fork 前 ， 我 们 获取 termios 和 winsize 结 构 的 当前 值 ， 将 其 
作为 参数 传递 给 pty_fork。 通 过 这 种 方法 ，PTY 从 设备 具有 和 当前 终端 
相同 的 初始 状态 。 

子 进 程 从 pty_fork 返 回 后 ， 可 选 地 关闭 了 PTY 从 设备 的 回 显 ， 然 后 
调用 execvp 来 执行 命令 行 指 定 的 程序 。 所 有 余下 的 命令 行 参 数 将 成 为 该 
程序 的 参数 。 

父 进程 可 选 地 将 用 户 终 端 设置 为 原始 模式 。 在 这 种 情况 下 ， 父 进程 
还 要 设置 退出 处 理 程序 ， 使 得 在 调用 exit 时 复原 终端 状态 。 下 一 节 将 插 
述 do_driver 函 数 。 

接 下 来 ， 父 进程 调用 函数 loop CULAR] 19-12) ， 该 函数 仅仅 是 将 从 
标准 输入 接收 到 的 所 有 内 容 复制 到 PTY 主 设备 ， 并 将 PTY 主 设备 接收 到 
的 所 有 内 容 复制 到 标准 输出 。 尽 管 使 用 select 或 poll 的 单 进程 或 多 线程 是 


可 行 的 ， 但 是 为 了 有 所 变化 ， 这 里 使 用 了 两 个 进程 。 


#include "apue ,hm 
tdefine BUFFSIZE 512 


static void sig_term(int); 
static volatile sig atomic t sigcaught; /* set by signal handler */ 


vold 
loop(int ptym, int ignoreeof) 
| 

pidt child; 

int nread; 

char buf [BUFFSIZE); 


if ((child = fork()) < 0) { 
err sys("fork error"); 
} else if (child == 0) { /* child copies stdin to ptym */ 
for (77) | 
if ((nread = read(STDIN FILENO, buf, BUFESIZE)) < 0) 
err sys("read error from stdin"); 
else if (nread == 0) 


break; /* EOF on stdin means we're done */ 
if (writen(ptym, buf, nread) != nread) 
err sys ("writen error to master pty"); 


/* 
* We always terminate when we encounter an EOF on stdin, 
* but we notify the parent only if ignoreeof is 0. 
a 
if (ignoreeof == 0) 
kill(getppid(), SIGTERM); /* notify parent */ 
exit(0); /* and terminate; child can't return */ 


/* 
* Parent copies ptym to stdout. 
“/ 
if (signal_intr(SIGTERM, sig_term) == SIG ERR) 
err_sys("signal_intr error for SIGTERM"); 
for (2 4) t 
if ((nread = read(ptym, buf, BUFFSIZE)) <= 0) 
break; /* signal caught, error, or EOF */ 
if (writen(STDOUT FILENO, buf, nread) != nread) 
err_sys ("writen error to stdout"); 
} 
/* 


* There are three ways to get here: sig_term() below caught the 
* SIGTERM from the child, we read an EOF on the pty master (which 
* means we have to signal the child to stop), or an error. 
yf 
if (sigcaught == 0) /* tell child if it didn't send us the signal */ 
kill (child, SIGTERM) ; 


/* 
* Parent returns to caller. 
i 


/* 
* The child sends us SIGTERM when it gets EOF on the pty slave or 
* When read() fails. We probably interrupted the read() of ptym. 
i 

static void 

sig_term(int signo) 

{ 

sigcaught = 1; /* just set flag and return */ 





图 19-12 loop 函 数 
注意 ， 因 为 使 用 了 两 个 进程 ， 所 以 一 个 终止 时 ， 必 须 通 知 另 一 个 。 
我 们 用 SIGTERM 信号 进行 这 种 通知 。 


19.0 ty 本 


U ee 的 应 用 实例 ， 并 了 解 使 用 不 同 命令 行 选项 的 
必要 性 。 

如 果 使 用 Korn shell， 那 么 我 们 执行 命令 : 

pty ksh 

会 得 到 一 个 运行 在 伪 终 端 下 的 全 新 shell。 

如 果 文 件 ttyname 包 含 了 图 18-16 中 所 示 的 程序 ， 那 么 可 按 如 下 模式 
执行 pty 程 序 : 

$ who 

sar console May 19 16:47 

sar ttys000 May 19 16:47 

sar ttys001 May 19 16:48 

sar ttys002 May 19 16:48 

sar ttys003 May 19 16:49 





sar ttys004 May 19 16:49 ttys004 是 当前 使 用 的 最 高 PTY 设 备 
$ pty ttyname 在 PTY 上 运行 网 18-16 中 的 程序 
fd 0: /dev/ttys005 ttys005 是 下 一 个 可 用 的 PTY 


fd 1: /dewttys005 

fd 2: /dewttys005 

1. utmp 文 件 

6.8 节 讨论 过 记录 当前 登录 到 UNIX 系 统 的 用 户 的 utmp 文 件 。 那 么 在 
伪 终 端 上 运行 程序 的 用 尸 是否 被 认为 是 登录 了 呢 ? 如 果 是 用 telnetd 和 
rlogind 远 程 登录 ， 显 然 在 伪 终 端 上 登录 的 用 户 应 该 在 utmp 文 件 中 有 相应 
记录 项 。 但 是 ， 通 过 窗口 系统 或 script 类 程序 在 伪 终 端 上 运行 shell 的 用 户 
是 否 应 该 在 utmp 文 件 中 有 相应 记录 项 呢 ? 有 的 系统 有 记录 ， 有 的 没有 。 
如 果 在 utmp 文 件 中 没有 记录 的 话 ，who(1 程序 一 般 不 会 显示 相应 伪 终 端 
正在 被 使 用 。 

除非 utmp 文 件 允 许 其 他 用 户 的 写 权限 (这 被 认为 是 一 个 安全 汤 
洞 ;， 人 否则 一 般 使 用 伪 终 端的 程序 将 不 能 对 utmp 文 件 进行 写 操作 。 

2. 作业 控制 交互 

当 在 pty 下 运行 作业 控制 shell 时 ， 它 能 够 正常 地 运行 。 例 如 ， 

pty ksh 

将 在 pty 下 运行 Korn ”shell。 我 们 能 够 在 这 个 新 shell 下 运行 程序 并 使 




















用 作业 控制 ， 这 如 同 在 登录 shell 中 一 样 。 但 如 果 在 pty 下 运行 一 个 交互 式 
程序 而 不 是 作业 控制 shell， 例 如 ， 

pty cat 

那么 在 键入 作业 控制 挂 起 字符 之 前 该 程序 的 运行 一 切 正常 。 而 在 键 
入 作业 控制 挂 起 字符 时 ， 作 业 控 制 挂 起 字符 将 会 被 显示 为 2， 并 且 被 名 
略 。 在 早期 基于 BSD 的 系统 中 ，cat 进程 终止 ，pty 进 程 终 止 ， 回 到 初始 
登录 shell。 为 了 明白 其 中 的 原因 ， 我 们 需要 检查 所 有 相关 的 进程 以 及 这 
些 进程 所 属 的 进程 组 和 会 话 。 图 19-13 显 示 了 pty cat 运 行 时 的 安排 。 

键入 挂 起 字符 〈Cul+Z) 时 ， 它 被 cat 进 程 下 的 行规 程 模块 所 识别 ， 
这 是 因为 pty 将 终端 (在 pty 父 进程 之 下 ) 设置 为 原始 模式 。 但 内 核 不 会 
停止 cat 进 程 ， 这 是 因为 它 属 于 一 个 孤儿 进程 组 〈 见 9.10 节 ) 。cat 的 父 进 
程 是 pty 父 进程 ， 它 属于 另 一 个 会 话 。 























图 19-13 pty cat 的 进程 组 和 会 话 

历史 上 ， 不 同 的 系统 处 理 这 种 情况 的 方法 也 不 同 。POSIX.1 只 是 说 
HH SIGTSTP 信号 不 能 被 发 送 给 进程 。4.3BSD 的 派生 系统 向 进程 递送 一 
个 它 从 不 捕获 的 SIGKILL 信号。4.4BSD 没 有 采用 发 送 SIGKILL 信 号 的 
方法 ， 转 而 采用 符合 于 POSIX.1 的 处 理 方法 。 如 果 SIGTSTP 信 号 具有 默 
认 配 置 ， 并 且 传 递 给 孤儿 进程 组 中 的 一 个 进程 ， 那 么 4.4BSD 的 内 核 会 无 
声明 地 丢弃 SIGTSTP 信 号 。 大 多 数 当 前 的 实现 都 采用 这 种 处 理 模式 。 

当 我 们 使 用 pty 来 运行 作业 控制 shell 时 ， 被 这 个 新 shell 调 用 的 作业 决 
不 会 是 任何 孤儿 进程 组 的 成 员 ， 这 是 因为 作业 控制 shell 总 是 属于 同一 个 





会 话 。 在 这 种 情况 下 ， 键 入 的 Ctrl+Z 被 发 送 到 由 shell 调 用 的 进程 ， 而 不 
是 shell 本 号 。 

让 pty 调 用 的 进程 能 够 处 理 作业 控制 信号 的 唯一 的 方法 是 : 另外 增 
加 一 个 pty 命 令 行 标志 ， 使 pty 子 进程 自己 能 够 识别 作业 挂 起 字符 〈 在 pty 
TEP) ， 而 不 是 让 该 字符 穿越 所 有 路 程 而 到 达 男 一 个 行规 程 模块 。 

3. 检查 长 时 间 运 行程 序 的 输出 

另 一 个 使 用 pty 进 行 作 业 控 制 交互 的 实例 见 图 19-7。 如 果 运 行 一 个 组 
慢 产生 输出 的 程序 : 

pty slowout > file.out & 

当 子 进程 试图 从 标准 输入 《终端 ) 读 入 数据 时 ，Pty 进 程 立 刻 停 目 
运行 。 这 是 因为 该 作业 是 一 个 后 台 作 业 ， 并 且 当 它 试 图 访问 终端 时 会 使 
anes 如 果 将 标准 输入 重 定 回 使 得 pty 不 从 终端 读 取 数 据 ， 

H: 

pty slowout < /dev/null > file.out & 

那么 pty 程 序 也 立即 停止 ， 因 为 它 从 标准 输入 和 终端 读 取 到 一 个 文 
件 结束 符 。 解 决 这 个 问题 的 方法 是 使 用 -i 选项 ， 这 个 选项 的 含义 是 忽略 
来 自 标 准 输入 的 文件 结束 符 : 

pty -i slowout < /dev/null > file.out & 

这 个 标志 导致 在 遇 到 文件 结束 符 时 ， 图 19-13 的 pty 子 进程 退出 ， 但 
子 进程 不 会 告诉 父 进程 终止 。 相 反 ， 父 进程 一 直 将 PTY 从 设备 的 输出 复 
制 到 标准 输出 (本 例 中 是 文件 file.out》。 

4. script 程 序 

使 用 pty 程 序 可 以 把 script(1) 程 序 实现 成 下 面 shell 脚 本 : 

#!/bin/sh 

pty "${SHELL:-/bin/sh}" | tee typescript 

一 旦 执行 这 个 shell 脚 本 ， 即 可 执行 ps 命令 来 观察 进程 之 间 的 关系 。 
图 19-14 详 细 地 显示 了 这 些 关 系 。 
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图 19-14 script shell 脚 本 的 进程 安排 





管道 

在 这 个 例子 中 ， 假 设 SHELL 变 量 是 Korn shell 〈 可 能 是 /bin/ksh) 。 
如 前 面 所 述 ，script 仅 仅 是 将 新 的 ”shell (和 它 调 用 的 所 有 的 子 进程 ) 的 
输出 复制 出 来 ， 但 是 因为 PTY 从 设备 上 的 行规 程 模块 通常 允许 回 显 ， 
所 以 绝 大 多 数 键入 也 都 被 写 到 typescript 文 件 中 。 

5. 运行 协同 进程 

在 图 15-8 所 示 的 程序 中 ， 协 同 进程 不 能 使 用 标准 WO 函 数 ， 其 原因 是 
ee ee 所 以 标准 W/O 函数 会 将 它们 放 到 绥 冲 区 

。 如 未 把 











if (execl("./add2", "add2", (char *)0) < 0) 
7 TRIM 

if (execl("./pty", "pty", "-e", "add2", (char *)0) < 0) 

在 pty 下 运行 协同 进程 ， 该 程序 即使 使 用 了 标准 VO 仍然 可 以 正确 运 


图 19-15 显 示 了 在 使 用 伪 终 端 作为 协同 进程 的 输入 和 输出 时 ， 进 程 
的 安排 。 这 是 图 19-6 的 扩充 ， 它 显示 了 所 有 的 进程 连接 和 数据 流 。 框 中 
的 “驱动 程序 ”是 按 前 面 的 说 明 更 改 了 execl 的 图 15-8 的 程序 。 

这 一 实例 显示 了 -e PAET) 选项 对 于 pty 程 序 的 重要 性 。 因 为 pty 
程序 的 标准 输入 没有 连接 到 终端 ， 所 以 它 不 以 交互 方式 运行 。 在 图 19- 
11 程序 中 ，interactive 标志 默认 为 假 ， 这 是 因为 对 isatty 调 用 的 返回 是 
假 。 这 意味 着 真正 终 问 上 的 行规 程 保 持 在 规范 模式 下 ， 并 允许 回 显 。 指 
定 -e 选 项 后 ， 关 挥 了 PTY 从 设备 上 的 行规 程 模块 的 回 显 。 如 果 不 这 样 
做 ， 则 键入 的 每 一 个 字符 都 将 被 两 个 行规 程 模 块 各 回 显 一 次 。 
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图 19-15 运行 一 个 协同 进程 ， 以 伪 终 端 作为 其 输入 和 输出 

还 能 用 -e 选 项 关闭 termios 结 构 的 ONLCR 标 志 ， 以 防止 所 有 协同 进程 
的 输出 被 回 车 和 换行 符 终止 。 

在 不 同 的 系统 上 测试 这 个 例子 ， 会 遇 到 14.7 节 中 描述 readn 和 writen 
函数 时 顺便 提 到 的 同样 问题 。 当 描述 符 引 用 的 不 是 普通 磁盘 文件 时 ， 从 
read 返 回 的 数据 量 可 能 会 因 两 个 实现 之 间 的 不 同 而 有 所 区 别 。 使 用 pty 的 
协同 进程 实例 产生 了 非 预期 的 结果 ， 其 原因 可 追溯 至 图 15-18 的 程序 中 
读 管道 的 read 函 数 ， 它 返回 的 结果 不 足 一 行 。 解 决 方法 是 不 使 用 图 15-18 
中 的 程序 ， 而 是 要 使 用 来 自 于 习题 15.5 针 对 这 个 程序 的 另外 一 个 版 本 ， 
这 个 版 本 改 用 标准 IJO 库 ， 将 两 个 管道 的 标准 IO 流 都 设置 为 行 缓冲 。 这 
样 ，fgets 函 数 将 会 读 完 一 个 整 行 。 图 15-18 的 程序 中 的 while 循 环 假设 发 
送 到 协同 进程 的 每 一 行 都 会 带 来 一 行 的 返回 结 











6. 非 交 互 地 驱动 交互 式 程序 

虽然 让 pty 运 行 任意 协同 进程 ， 甚 至 交互 式 的 协同 进程 的 想法 很 诱 
人 ， 但 这 是 行 不 通 的 。 问 题 在 于 pty 只 是 将 其 标准 输入 复制 到 PTY， 并 将 
来 自 PTY 的 数据 复制 到 其 标准 输出 ， 而 并 不 关心 具体 发 送 的 或 得 到 的 是 
什么 数据 。 
举 个 例子 ， 我 们 可 以 在 pty 下 运行 telnet 命 令 ， 直 接 与 远程 主机 对 
TA: 

pty telnet 192.168.1.3 

这 样 做 与 直接 键入 telnet 192.168.1.3 相 比 ， 并 没有 带 来 更 多 的 好 
处 ， 但 我 们 可 能 希望 在 一 个 脚本 中 运行 telnet 程 序 ， 其 目的 很 可 能 是 要 
检验 远程 主机 的 某 个 条 件 。 如 果 telnet.cmd 文 件 包 括 下 面 4 行 : 

Sar 

passwd 

uptime 

exit 

第 1 行 是 登录 到 远程 主机 时 使 用 的 用 户 名 ， 第 2 行 是 口令 ， 第 3 行 是 
希望 运行 的 命令 ， 第 4 行 终止 此 会 话 。 如 果 按 下 列 方式 运行 此 脚本 : 

pty -i < telnet.cmd telnet 192.168.1.3 

那么 ， 它 不 会 像 我 们 所 想 的 那样 操作 。 而 是 ，telnet.cmd 文 件 的 内 容 
在 还 没有 得 到 机 会 提示 我 们 输入 账户 名 和 口令 之 前 ， 束 被 发 送 到 了 远程 
主机 。 当 它 关 闭 回 显 而 读 口 令 时 ，login 使 用 tcsetattr 选项 ， 于 是 丢弃 了 
己 在 队列 中 的 所 有 数据 。 这 样 一 来 ， 我 们 发 送 的 数据 就 被 丢掉 了 。 

当 以 交互 方式 运行 telnet 程 序 时 ， 我 们 等 待 远程 主机 发 出 输入 口令 
的 提示 ， 然 后 再 键入 口令 ， 但 是 pty 程 序 不 知道 这 样 做 。 这 就 是 需要 一 
个 比 pty 更 巧妙 的 程序 ， 如 expect， 从 脚本 文件 驱动 交互 式 程序 的 原因 。 

即使 如 前 所 示 那 样 从 图 15-18 程 序 运 行 pty， 这 也 没有 任何 帮助 。 
为 图 15-18 中 的 程序 认为 它 在 一 个 管道 写 入 的 每 一 行 都 会 在 男 一 个 管道 
产生 一 行 。 对 于 一 个 交互 式 程序 ， 输 入 一 行 可 能 产生 多 行 输出 。 更 进 一 
步 ， 图 15-18 中 的 程序 在 从 协同 进程 读 之 前 ， 它 总 是 先 发 送 一 行 给 该 进 
程 。 如 果 想 在 发 送 给 协同 进程 一 些 数据 之 前 从 协同 进程 处 读 ， 这 种 策略 
BAT ANI To 

有 一 些 从 shell 脚 本 驱动 交互 式 程序 的 方法 。 可 以 在 pty 上 增加 一 种 命 
令 语 言 和 一 个 解释 器 。 但 是 一 个 适当 的 命令 语言 可 能 十 倍 于 pty 程 序 的 
大 小 。 另 一 种 选择 是 使 用 命令 语言 并 用 pty_fork 函 数 来 调用 交互 式 程 
序 ， 这 正 是 expect 程 序 所 做 的 。 

我 们 将 采用 一 种 不 同 的 途径 ， 使 用 选项 -d 使 Pty 程 序 的 输入 和 输出 与 
驱动 进程 连接 起 来 。 该 驱动 进程 的 标准 输出 是 pty 的 标准 输入 ， 反 之 亦 












































然 。 这 有 点 像 协 同 进程 ， 只 是 在 pty 的 “ 另 一 边 ”。 此 种 进程 结构 与 图 19- 
15 中 所 示 的 几乎 相同 ， 只 是 在 这 种 场景 中 ， 由 pty 来 完成 驱动 进程 的 fork 
和 exec。 而 且 我 们 在 pty 和 驱动 进程 二 者 之 间 使 用 的 是 一 个 双 同 的 流 管 
道 ， 而 不 是 两 个 半 双 工 管 道 。 

图 19-16 展 示 的 是 do_driver 函 数 的 源 代 码 ， 在 使 用 -d 选 项 时 ， 该 函数 
由 pty《〈 见 图 19-11) 的 main 函 数 调用 。 


finclude "apue.h" 


void 
do driver (char *driver) 
| 
pidt child; 
int pipe(2]; 


/* 
* Create a full-duplex pipe to communicate with the driver. 
t 
if (fd_pipe(pipe) < 0) 
err sys("can't create stream pipe"); 


if ((child = fork()) < 0) { 
err sys("fork error"); 

} else if (child == 0) | /* child */ 
close (pipe(1]) ; 


/* stdin for driver */ 
if (dup2 (pipe[0], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 


/* stdout for driver */ 

if (dup2 (pipe [0], STDOUT FILENO) != STDOUT FILENO) 
err sys("dup2 error to stdout"); 

if (pipe(0] != STDIN FILENO && pipe[0] != STDOUT FILENO) 
close (pipe[0]); 


/* leave stderr for driver alone */ 
execlp(driver, driver, (char *)0); 
err sys("execlp error for: %s", driver); 


close (pipe[0]); /* parent */ 

if (dup2(pipe(1], STDIN FILENO) != STDIN FILENO) 
err sys("dup2 error to stdin"); 

if (dup2(pipe[1], STDOUT FILENO) != STDOUT FILENO) 
err_sys("dup2 error to stdout"); 

if (pipe[1] != STDIN FILENO && pipe[1] != STDOUT FILENO) 
close (pipe [1]); 





/* 
* Parent returns, but with stdin and stdout connected 
* to the driver, 


Y 





19-16 pty 程 序 的 do_driver 函 数 
通过 我 们 自己 编写 由 pty 调 用 的 驱动 程序 ， 可 以 按 我 们 所 希望 的 方 
式 驱 动 交互 式 程序 。 即 使 驱动 程序 有 和 pty 连 接 在 一 起 的 标准 输入 和 标 
准 输 出 ， 驱 动 进程 仍然 可 以 通过 读 、 写 /dev/tty 同 用 户 交 互 。 这 个 解决 方 








法 仍 不 如 expect 程 序 通 用 ， 但 是 它 用 不 到 50 行 的 代码 提供 了 pty 的 一 种 实 
用 的 选项 。 


19.7 高 级 特性 


伪 终 端 还 有 其 他 特性 ， 我 们 在 这 里 简略 提 一 下 。Sun 
Microsystems[2002] 和 BSD pts(4) 的 手册 页 对 此 有 更 详细 的 说 明 。 

1. 打包 模式 

打包 模式 (packet mode) 能 够 使 PTY 主 设备 了 解 到 PTY 从 设备 的 状 
态 变 化 。 在 Solaris 系 统 中 ， 可 以 通过 将 STREAMS 模 块 pckt 压 入 PTY 主 设 
备 端 来 设置 这 种 模式 。 图 19-2 显 示 了 这 种 可 选 模块 。 在 FreeBSD、Linux 
和 Mac OS X 中 ， 可 以 用 TIOCPKT ioctl 命 令 来 设置 这 种 模式 。 

Solaris 和 其 他 平台 相 比 较 ， 具 体 的 打包 模式 有 所 不 同 。 在 Solaris 
中 ， 读 取 PTY 主 设备 的 进程 必须 调用 getmsg 从 流 首 取 得 消息 ， 这 是 因 
为 pekt 模块 将 一 些 事件 转化 成 了 无 数据 的 STREAMS 消 息 。 在 其 他 平台 
中 ， 每 一 次 对 PTY 主 设备 的 读 操 作 都 会 返回 带 有 可 选 数据 的 状态 字 节 。 

无 论 实 现 细 节 如 何 ， 打 包 模 式 的 目的 是 ， 当 PTY 从 设备 上 的 行规 程 
模块 出 现 以 下 事件 时 ， 通 知 进程 从 PTY 主 设备 读 取 数 据 : 读 队 列 被 冲 
洗 ;， 写 队列 被 冲洗 ， 和 输出 被 停止 〈 如 Ctrl+S) ， 输 出 重新 开始 ， 
XON/XOFF 流 控 制 被 禁用 后 重新 启用 ，XON/XOFF 流 控 制 被 启用 后 重 
新 禁用 。 这 些 事件 由 rlogin 客 户 进 程 和 rlogind 服 务 嚣 进程 使 用 。 

2. 远程 模式 

PTY 主 设备 可 以 用 TIOCREMOTE “ioctl 命 令 将 PTY 从 设备 设置 成 远 
程 模式 。 虽 然 FreeBSD、Mac OS X 10.6.8 和 Solaris 10 使 用 同样 的 命令 来 
启用 或 禁用 这 个 特性 ， 但 是 在 Solaris 中 ，ioctl 的 第 三 个 参数 是 一 个 整 型 
数 ， 而 在 Mac OS Xx 中 则 是 一 个 指 问 整 型 数 的 指针 。 (FreeBSD 8.0 和 
Linux 3.2.0 不 支持 这 一 命令 。) 

当 PTY 主 设备 将 PTY 从 设备 设置 成 这 种 模式 时 ， 它 通知 PTY 从 设备 
上 的 行规 程 模 块 对 从 主 设 备 接收 到 的 任何 数据 都 不 进行 任何 处 理 ， 不 管 
从 设备 termios 结构 中 的 规范 或 非 规 范 标 志 是 否 设 置 ， 都 是 这 样 。 远 程 
模式 适用 于 窗口 管理 器 这 种 进行 自己 的 行 编辑 的 应 用 程序 。 

3. 窗口 大 小 变化 

PTY 主 设备 上 的 进程 可 以 用 TIOCSWINSZ ioctl 命 令 来 设置 从 设备 的 
窗口 大 小 。 如 果 新 的 大 小 和 当前 的 大 小 不 同 ，SIGWINCH 信 和 号 将 被 发 送 
到 PTY 从 设备 的 前 台 进 程 组 。 

4. 信号 发 生 

读 、 写 PTY 主 设备 的 进程 可 以 向 PTY 从 设备 的 进程 组 发 送信 号 。 在 























Solaris _ 10 中 ， 可 以 用 TIOCSIGNAL ioctl 命 令 做 到 这 一 点 。 在 FreeBSD 
8.0、Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 用 TIOCSIG ioctl 来 做 到 这 一 点 。 
在 这 两 种 情况 下 ， 第 三 个 参数 都 是 信号 编号 值 。 


19.8 小 结 


本 章 开 始 部 分 简要 叙述 了 如 何 使 用 伪 终 喘 ， 并 观察 了 某 些 应 用 实 
例 。 接 着 ,分 析 说 明了 在 本 书 讨论 的 4 种 平台 上 打开 伪 终 端 所 需 的 代 
码 。 然 后 用 此 代码 提供 了 通用 pty_fork 函 数 ， 它 可 用 于 多 种 不 同 的 应 
用 。 该 函数 是 小 程序 《pty) 的 基础 ， 我 们 使 用 这 一 程序 揭示 了 伪 终 端 
的 许多 属性 。 

伪 终 端 在 大 多 数 UNIX 系 统 中 每 天 都 被 用 来 进行 网 络 登录 。 我 们 还 
检查 了 伪 终 端的 许多 其 他 用 途 ， 从 script 程 序 到 使 用 批 处 理 脚本 来 驱动 
交互 式 程序 等 。 





习题 


19.1 ， 当 用 telnet 或 rlogin 远 程 登录 到 一 个 BSD 系 统 上 时 ， 像 我 们 在 
PTY 从 设备 的 所 有 权 和 权限 被 设置 。 该 过 程 是 如 
可 发 生 的 ? 

19.2 使 用 pty 程 序 来 确定 你 的 系统 用 于 初始 化 PTY 从 设备 的 termios 结 
构 和 winsize 结 构 的 值 。 

19.3 重 写 loop 函 数 〈( 见 图 19-12) ， 使 之 成 为 使 用 select 或 poll 的 单个 
进程 。 

19.4 在 子 进程 中 ，pty_fork 返 回 后 ， 标 准 输入 、 标 准 输出 和 标准 错 
误 都 以 读 与 模式 打开 。 能 够 将 标准 输入 变 成 只 读 ， 另 两 个 变 成 只 写 吗 ? 

19.5 在 图 19-13 中 ， 指 出 哪些 进程 组 是 前 台 的 ， 哪 些 进程 组 是 后 台 
的 ， 并 指出 会 话 首 进程 。 

19.6 在 图 19-13 中 ， 当 键入 文件 终止 符 时 ， 进 程 终止 的 顺序 是 什 
么 ? 如 果 可 能 的 话 ， 用 进程 会 计 信 息 验 证 之 。 

19.7 _ script(1) 程 序 通常 在 输出 文件 头 增加 一 行 说 明 它 的 开始 时 间 ， 
在 输出 文件 末尾 增加 一 行 说 明 它 的 结束 时 间 。 将 这 些 特性 添加 到 本 章 展 
示 的 简单 的 shell 脚 本 中 。 

19.8 解释 为 什么 在 下 面 的 例子 中 ， 即 使 程序 ttyname〈 见 图 18-16) 
只 产生 输出 而 不 读 入 的 情况 下 ， 文 件 data 的 内 容 还 被 输出 到 终端 上 。 

$ cat data 一 个 两 行 的 文件 

hello, 

world 

$ pty -i < data ttyname -i -i 表示 忽略 stdin 的 文件 结束 标志 

hello, 这 两 行 来 自 何 处 ? 

world 

fd 0:/dev/ttys005 我 们 期 望 ttyname 输 出 这 3 行 

fd 1:/dev/ttys005 

fd 2:/dewttys005 

19.9 编写 一 个 调用 pty_fork 的 程序 ， 访 程序 有 一 个 子 进程 ， 该 子 进 
程 exec 另 一 个 你 写 的 程序 。 子 进程 exec 的 新 程序 能 够 捕获 SIGTERM 和 
SIGWINCH。 当 捕获 到 信号 时 ， 要 打印 出 有 关 消 轧 ， 并 且 对 于 后 一 种 信 
号 ， 还 要 打印 终端 窗口 大 小 。 然 后 让 父 进程 用 19.7 节 描 述 过 的 ioctl 命 令 
向 PTY 从 设备 的 进程 组 发 送 SIGTERM 信 号 。 从 PTY 从 设备 读 回 消息 并 验 











证 捕获 到 了 该 信号 。 接 下 来 由 父 进程 设置 PTY 从 设备 窗口 的 大 小 ， 并 再 
读 回 PTY 从 设备 的 输出 。 让 父 进程 退出 Cexit) 并 确定 PTY 从 设备 进程 
征 否 也 要 终止 ， 如 果 要 终止 ， 应 如 何 终止 ? 
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20.1 5| E 


20 世 纪 80 年 代 早 期 ，UNIX 系 统 被 认为 不 适合 运行 多 用 户 数据 库 系 
统 〈 见 Stonebraker[1981] 和 Weinberger[1982]) 。 早 期 的 系统 (如 V7) ， 
因为 没有 提供 任何 形式 的 IPC 机 制 ( 除 了 半 双 工 管道 ) ， 也 没有 提供 任 
何 形式 的 字 贡 范围 锁 机 制 ， 所 以 确实 不 适合 运行 多 用 户 数据 库 系 统 。 但 
是 ， 这 些 缺 陷 中 的 大 多 数 都 已 得 到 纠正 。 到 20 世 纪 了 80 年 代 后 期 ， 
UNIX 系 统 已 为 运行 可 靠 的 、 多 用 户 的 数据 库 系 统 提供 了 一 个 适合 的 环 
境 。 自 那 时 以 来 ， 很 多 商业 公司 都 已 提供 这 种 数据 库 系统 。 

本 章 将 开发 一 个 简单 的 、 多 用 户 数 据 库 的 C 了 水 数 库 。 调 用 此 函数 库 
提供 的 C 语 言 函 数 ， 其 他 程序 可 以 获取 和 存储 数据 库 中 的 记录 。 (这 类 
数据 库 通常 被 称 为 键 - 值 存储 。) 这 个 C 函数 库 只 是 一 个 完整 的 数据 库 
系统 的 一 部 分 ， 我 们 并 不 开发 其 他 部 分 (如 查询 语言 等 ) ， 关 于 其 他 部 
分 可 以 参阅 专门 介绍 数据 库 的 教科 书 。 我 们 感 兴趣 的 是 数据 库 函 数 库 与 
UNIX 的 接口 ， 以 及 这 些 接 口 与 前 面 各 章节 所 涉及 主题 的 天 系 〈 如 14.3 
节 的 字 节 范围 锁 ) 。 

















20.2 历史 


dbm(3) 是 一 个 在 UNIX 系 统 中 很 流行 的 数据 库 函 数 库 ， 它 由 Ken 
Thompson 开 发 ， 使 用 了 动态 散 列 结构 。 最 初 ， 它 与 V7 一 起 提供 ， 并 出 
现在 所 有 BSD 版 本 中 ， tuto ES VRamBSD ee SUF 中 [AT&T 
1990cl]。BSD 的 开发 者 扩充 了 dbm 函 数 库 ， 并 将 它 称 为 ndbm。ndbm 函 数 
库 包 括 在 BSD 和 SVR4 中 。ndbm 函 数 是 Single UNIX Specification 的 XSI 打 - 
展 标准 的 一 部 分 。 

Seltzer 和 Yigit[1991] 中 详细 介绍 了 dbm 函 数 库 使 用 的 动态 散 列 算法 
的 历史 ， 以 及 这 个 库 的 其 他 实现 方法 ， 如 dbm 函 数 库 的 GNU 版 本 
gdbm。 但 是 ， 这 些 实现 的 一 个 根本 限制 是 它们 都 不 文 持 多 个 进程 对 数 
据 库 的 并 发 更 新 。 To 《如 记录 锁 机 制 ) 。 

4.4BSD 提 供 了 ， 该 库 支 持 3 种 不 同 的 访问 模 
式 : 面 癌 记录 、 HNB. 同样 ， db 也 没有 提供 并 发 控制 (这 一 点 在 
db(3) 手 册页 的 BUGS 部 分 说 得 很 清楚 ) 。 

Oracle (http://www.oracle.com) 提供 了 几 个 版 本 的 db 函数 库 ， 它 
们 支持 并 发 访问 、 锁 机 制 和 事务 。 

大 部 分 商用 数据 库 函 数 库 提 供 多 进程 同时 更 新 数据 库 所 需要 的 并 发 
控制 。 这 些 系统 一 般 都 使 用 14.3 节 中 介绍 的 建议 记录 锁 机 制 ， 但 是 ， 它 
们 也 常常 实现 自己 的 锁 原 语 ， 以 避免 为 获得 一 把 无 苑 争 锁 而 需 的 系统 调 
用 开销 。 这 些 商 用 系统 通常 用 B+ 树 [Comer 1979] 或 某 种 动态 散 列 技术 ， 
如 线性 散 列 [Litwin 1980] 或 者 可 扩展 的 散 列 [Fagin et al. 1979] 来 实现 数据 


Ma 
图 20-1 列 出 了 本 书 说 明 的 4 种 操作 系统 常用 的 数据 库 函 数 库 。 注 意 
在 Linuxz 上 ，gdbm 库 既 文 持 dbm 函 数 库 ， 又 文 持 ndbm 函 数 库 。 
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20.3 PK 2 He 


本 童 开发 的 函数 库 类 似 于 ndbm 函 数 库 ， 但 增加 了 并 发 控制 机 制 ， 
从 而 允许 多 进程 同时 更 新 同一 数据 库 。 本 节 将 首先 描述 数据 库 函 数 库 的 
C 语 言 接 口 ， 下 一 节 再 讨论 其 实现 。 

当 打 开 一 个 数据 库 时 ， 通 过 返回 值得 到 一 个 代表 数据 库 的 句柄 〈 一 
个 不 透明 指针 ) 。 将 用 此 句柄 作为 参数 来 调用 其 他 数据 库 函 数 。 

#include "apue_db.h" 

DBHANDLE db_open(const char *pathname, int oflag, ... /* int mode 
*/); 





返回 值 : RD), EBSA; 奋 失 败 ， 返 回 NULL 
void db_close(DBHANDLE db); 

如 果 db_open 成 功 返 回 ， 则 将 建立 两 个 文件 :pathname.idx 和 
pathname.dat，pathname.idx 是 索引 文件 ，pathname.dat 是 数据 文件 。 人 参数 
oflag 作 为 传递 给 open〈 见 3.3 节 ) 的 第 二 个 参数 ， 来 指定 这 些 文 件 的 打 
开 模 式 《〈 只 读 、 读 / 写 或 如 果 文 件 不 存在 则 创建 等 ) 。 如 采 需 要 建立 新 
的 数据 库 ，mode 将 作为 第 三 个 参数 传递 给 open (文件 访问 权限 )。 

当 不 再 使 用 数据 库 时 ， 调 用 db_close 来 关闭 数据 库 。db_close 将 关闭 
索引 文件 和 数据 文件 ， 并 释放 数据 库 使 用 过 程 中 分 配 到 的 所 有 用 于 内 部 
缓冲 区 的 存储 空间 。 

当 疝 数据 库 中 存 入 一 条 新 的 记录 时 ， 必 须 提供 一 个 此 记录 的 键 ， 以 
及 与 此 键 相关 联 的 数据 。 如 果 此 数据 库存 储 的 是 人 事 信息 ， 键 可 以 是 员 
工 ID， 数 据 可 以 是 此 员工 的 姓名 、 地 址 、 电 话 号 码 以 及 受聘 日 期 等 。 实 
现 要求 每 条 记录 的 键 必须 是 唯一 的 〈 例 如 ， 不 会 有 两 个 员工 记录 有 同样 
的 员工 ID) 。 

#include "apue_db.h" 

int db_storeeDBHANDLE db, const char *key, const char *data, int 
flag); 

















返回 值 : 知 成 功 ， 返 回 0; Athan, eE CLP) 
key 和 data 是 由 null 字 符 终 止 的 字符 串 。 它 们 可 以 包含 除了 null 字 符 
外 的 任何 字符 ， 如 换行 符 。 
flag 参 数 只 能 是 DB_INSERT (插入 一 条 新 记录 ) 、 
DB_REPLACE 〈 蔡 换 一 条 已 有 的 记录 ) 或 DB_STORE (插入 一 条 新 记 
录 或 蔡 换 一 条 已 有 的 记录 ， 只 要 合适 无 论 哪 一 种 都 可 以 ) 。 这 3 个 常数 





定义 在 apue_db.h 头 文 件 中 。 如 果 使 用 DB_INSERT 或 DB_STORE， 并 
且 记 录 并 不 存在 ， 则 插入 一 条 新 记录 。 如 果 使 用 DB_REPLACE 或 
DB_STORE， 并 且 该 记录 已经 存在 ， 则 用 新 记录 蔡 换 已 有 记录 。 如 果 使 
用 DB_REPLACE， 而 记录 不 存在 ， 则 将 errno 设 置 为 ENOENT， 返 回 值 
为 -1， 并 且 不 加 入 新 记录 。 如 果 使 用 DB_INSERT， 而 记录 已 经 存在 ， 
则 不 插入 新 记录 ， 返 回 值 为 ”1。 在 这 里 ， 返 回 1 以 区 别 于 一 般 的 出 错 返 
El (-1) o 
通过 指定 键 key 可 以 从 数据 库 中 获取 一 条 记录 。 
#include "apue_db.h" 
char *db_fetch(DBHANDLE db, const char *key); 
返回 值 : 奎 成 功 ， 返 回 指 同 数据 的 指针 ; 知 没 有 找到 记录 ， 返 回 NULL 
如 果 找 到 了 记录 ， 返 回 指 问 通过 key 存 放 的 数据 的 指针 。 通 过 指定 
key， 也 可 以 在 数据 库 中 删除 一 条 记录 。 
#include "apue_db.h" 
int db_deleteEDBHANDLE db, const char *key); 
返回 值 ， 若 成 功 ， 返 回 0; 若 没 有 找到 记录 ， 返 回 -1 
除了 通过 指定 key 获 取 记 录 外 ， 还 可 以 逐条 记录 地 访问 数据 库 。 为 
此 ， 首 先 调 用 db _rewind 回 滚 到 数据 库 的 第 一 条 记录 ， 然 后 在 每 一 次 循 
环 中 调用 db_nextrec， 顺 序 地 读 每 条 记录 。 
#include "apue_db.h" 
void db_rewind(DBHANDLE db); 
char *db_nextrecC(DBHANDLE db, char *ke 
返回 值 : 知 成 功 ， 返 回 指向 数据 的 指针 ; 若 到 这 数据 库 文件 的 尾 庙 ， 返 
回 NULL 
如 果 key 是 非 空 指针 ，db_nextrec 将 这 个 指针 复制 到 存储 区 域 开始 的 
内 存 位 置 ， 然 后 返回 这 个 指针 。 
db_nextrec 不 保证 其 返回 记录 的 顺序 ， 只 保证 对 数据 库 中 的 每 一 条 
记录 只 读 取 一 次 。 如 果 顺 序 存储 3 条 键 分 别 为 A、B、C 的 记录 ， 则 无 法 
E nextrec 将 按 什么 顺序 返回 这 3 条 记录 。 它 可 能 按 B、A、C 的 顺序 
返回 ， 也 可 能 按 其 他 顺序 。 实 际 的 顺序 由 数据 库 的 实现 决定 。 
这 7 个 函数 提供 了 数据 库 函 数 库 的 接口 。 接 下 来 介绍 实现 。 






































20.4 实现 概述 


访问 数据 库 的 函数 库 通常 使 用 两 个 文件 来 存储 信息 : 一 个 索引 文件 
和 一 个 数据 文件 。 索 引文 件 包括 实际 的 索引 值 〈 键 〉 和 一 个 指 同 数据 文 
件 中 对 应 数据 记录 的 指针 。 有 许多 技术 可 用 来 组 织 索 引文 件 以 提高 按键 
查询 的 速度 和 效率 ， 散 列表 和 B+ 树 是 两 种 常用 的 技术 。 我 们 采用 固定 
大 小 的 散 列 表 来 组 织 索 引文 件 结构 ， 并 采用 链表 法 解决 散 列 冲突 。 在 介 
绍 db_open 时 ， 曾 提 到 将 创建 两 个 文件 ， 一 个 以 .idx 为 后 级 的 索引 文件 
和 一 个 以 .dat 为 后 级 的 数据 文件 。 

我 们 将 键 和 索引 以 null 结 尾 的 字符 串 形式 存储 ， 它 们 不 能 包含 任意 
的 和 二进制 数据 。 有 些 数 据 库 系统 用 二 进 制 形式 存储 数值 数据 (如 用 1 
个 、2 个 或 4 个 字 节 存储 一 个 整数 ) 以 节省 存储 空间 ， 这 样 一 来 使 函数 复 
杂 人 化， 也 使 数据 库 文 件 在 不 同 的 平台 间 移 植 比较 困难 。 例 如 ， 网 络 上 有 
两 个 系统 使 用 不 同 的 二 进 制 格式 存储 整数 ， 如 果 想 要 这 两 个 系统 都 能 够 
访问 数据 库 ， 束 必须 解决 不 同 存储 格式 的 问题 〈 今 天 不 同体 系 结构 的 系 
统 在 网 络 上 共享 文件 己 经 很 常见 了 )〉 。 按 照 字 符 串 形式 存储 所 有 的 记 
录 ， 包 括 键 和 数据 ， 能 使 这 一 切 变 得 简单 。 这 确实 需要 使 用 更 多 的 磁盘 
空间 ， 但 降低 了 获得 可 移植 性 需要 付出 的 代价 。 

db _store 要 求 对 于 每 个 键 ， 只 有 一 条 对 应 的 记录 。 有 些 数据 库 系 统 
允许 多 条 记录 使 用 同样 的 键 ， 并 提供 方法 访问 与 一 个 键 相关 的 所 有 记 
录 。 另 外 ， 我 们 只 有 一 个 索引 文件 ， 这 意味 着 每 个 数据 记录 只 能 有 一 个 
键 ( 我 们 不 支持 次 键 ) 。 有 些 数 据 库 允许 一 条 记录 拥有 多 个 键 ， 并 且 对 
每 一 个 键 使 用 一 个 索引 文件 。 当 插入 或 删除 一 条 记录 时 ， 要 对 所 有 的 索 
引文 件 进 行 相应 的 修改 。〔 一 个 拥有 多 个 索引 的 例子 是 员工 库 文 件 。 可 
以 将 员工 ID 作为 键 ， 也 可 以 将 员工 的 社会 保险 号 作为 键 。 由 于 员工 的 
名 字 并 不 保证 唯一 ， 所 以 名 字 不 能 作为 键 。) 

图 20-2 是 数据 库 实现 的 基本 结构 。 
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图 20-2 索引 文件 和 数据 文件 结构 
索引 文件 由 3 部 分 组 成 : 空闲 链表 指针 、 散 列表 和 索引 记录 。 网 20- 
2 中 ， 所 有 指针 字段 中 实际 存储 的 是 ASCII 码 数字 形式 的 文件 偏 移 量 。 
当 给 定 一 个 键 ， 要 在 数据 库 中 寻找 一 条 记录 时 ，db_fetch 根 据 该 键 
计算 散 列 值 ， 由 此 散 列 值 可 确定 一 条 散 列 链 《〈 链 表 指 针 字 段 可 以 为 0， 
表示 一 条 衬 的 散 列 链 ) 。 沿 着 这 条 散 列 链 ， 可 以 找到 所 有 具有 这 一 散 列 
值 的 索引 记录 。 当 遇 到 一 个 索引 记录 的 链表 指针 字段 为 0 时 ， 表 示 到 达 
了 此 散 列 链 的 末尾 。 
下 面 来 看 一 个 实际 的 数据 库 文 件 。 图 20-3 所 示 的 程序 建立 了 一 个 新 
的 数据 库 ， 并 且 写 入 了 3 条 记录 。 由 于 所 有 的 字段 都 以 ASCII 字 符 的 形式 
存储 在 数据 库 中 ， 所 以 可 以 用 任何 标准 的 UNIX 系 统 工具 来 得 看 索引 文 
件 和 数据 文件 : 
$ Is -| db4.* 
-rw-r--r-- 1 sar 28 Oct 19 21:33 db4.dat 
-rw-r--r-- 1 sar 72 Oct 19 21:33 db4.idx 
$ cat db4.idx 
053 350 
0 10Alpha:0:6 
0 10beta:6:14 
17 11gamma:20:8 
$ cat db4.dat 
data1 
Data for beta 
record3 
为 了 使 这 个 例子 紧凑 ， 将 每 个 指针 字段 的 大 小 设置 为 4 个 ASCII 字 
符 ， 将 散 列 链 的 数量 设置 为 3 条。 由 于 每 一 个 指针 中 记录 的 是 一 个 文件 
偏 移 量 ， 所 以 4 个 ASCII 字 符 限制 了 一 个 索引 文件 或 数据 文件 的 大 小 最 多 
只 能 为 10 000 字 节 。 当 在 20.9 节 做 性 能 测试 时 ， 将 指针 字段 的 大 小 设 为 6 
个 字符 (这 样 文件 大 小 可 以 达到 1 000 000 字 节 ) ， 将 散 列 链 数量 设 为 
100。 

















finclude "apue.h" 
#include "apue_db.h" 
include <fcntl.h> 


int 
main (void) 
| 
DBHANDLE db; 


if ((db = db open("db4", O_RDWR | O CREAT | 0_TRUNC, 
FILE MODE)) == NULL) 
err_sys("db_open error"); 


if (db_store(db, "Alpha", "datal", DB INSERT) != 0) 
err quit ("db store error for alpha"); 

if (db store(db, "beta", "Data for beta", DB INSERT) != 0) 
err quit ("db store error for beta"); 

if (db_store(db, "gamma", "record3", DB_INSERT) != 0) 
err quit ("db store error for gamma"); 


db close (db) ; 
exit (0); 


图 20-3 建立 一 个 数据 库 并 写 入 3 条 记录 
索引 文件 的 第 一 行为 : 
053350 
分 别 为 空闲 链表 指针 (OFAN ZENER AZ) 和 3 个 散 列 链 的 指针 : 
53、35 和 0。 下 一 行 : 





0 10Alpha:0:6 

显示 了 一 条 索引 记录 的 结构 。 第 一 个 4 字符 字段 (0) 为 链表 指 
针 ， 表 示 这 一 条 记录 是 此 散 列 链 的 最 后 一 条 。 下 一 个 4 字符 字段 (10) 
为 idx len 〈 索 引 记 录 长 度 ) ， 表 示 此 索引 记录 剩余 部 分 的 长 度 。 用 两 个 
read 操 作 来 读 取 一 条 索引 记录 : 第 一 个 read 读 取 这 两 个 固定 长 度 的 字段 

(链表 指针 和 索引 记录 长 度 ) ， 然 后 再 根据 索引 记录 长 上 度 来 读 取 后 面 的 
不 定 长 部 分 。 剩 下 的 3 个 字段 为 : 键 、 数 据 记 录 的 偏 移 量 和 数据 记录 的 
长 度 。 这 3 个 字段 用 分 隔 符 隔 开 ， 此 处 使 用 的 分 隔 符 是 冒号 。 由 于 这 3 
个 字段 都 是 不 定 长 的 ， 所 以 需要 一 个 专门 的 分 隔 符 ， 而 且 这 个 分 隔 符 不 
能 出 现在 键 中 。 最 后 用 一 个 mm 《换行 符 ) 结束 这 一 条 索引 记录 。 由 于 在 
索引 记录 长 度 字 段 中 已 经 有 了 记录 的 长 度 ， 所 以 这 个 换行 符 并 不 是 必需 
的 ， 加 上 换行 符 是 为 了 把 各 条 索引 记录 人 分开， 这样 就 可 以 用 标准 的 
UNIX 系 统 工 具 〈 如 cat 和 more) 来 查看 索引 文件 。 键 字段 是 将 记录 写 入 
数据 库 时 指定 的 值 。 数 据 记 录 在 数据 文件 中 的 偏 移 量 为 0， 长 度 为 6。 从 
数据 文件 中 可 看 到 数据 记录 确实 从 0 开始 ， 长 度 为 6 个 字 节 。 (与 索引 文 
件 一 样 ， 这 里 自动 在 每 条 数据 记录 的 后 面 奶 加 一 个 换行 符 ， 以 便于 使 用 
UNIX 系 统 工具 。 在 调用 db_fetch 时 ， 此 换行 符 不 作为 数据 返回 。) 

如 果 在 这 个 例子 中 跟踪 3 条 散 列 链 ， 可 以 看 到 第 一 条 散 列 链 上 第 一 
条 记录 的 偏 移 量 是 53 (gamma) 。 这 条 链 上 下 一 条 记录 的 偏 移 量 大 
17 (alpha) ， 并 且 是 这 条 链 上 的 最 后 一 条 记录 。 第 二 条 散 列 链 上 的 第 一 
ee (beta) ， 且 是 此 链 上 最 后 一 条 记录 。 第 三 条 散 列 
链 为 空 。 

请 注意 ， 索 引文 件 中 键 的 顺序 和 数据 文件 中 对 应 数据 记录 的 顺序 与 
图 20-3 程序 中 调用 db_store 的 顺序 一 样 。 由 于 在 调用 db_open 时 使 用 了 
O_TRUNC 标 志 ， 索 引文 件 和 数据 文件 都 被 截断 了 ， 整 个 数据 库 相 当 于 
重新 初始 化 。 在 这 种 情况 下 ，db_store 将 新 的 索引 记录 和 数据 记录 追加 
到 对 应 的 文件 末尾 。 后 面 将 看 到 ，db_store 还 可 以 重复 使 用 这 两 个 文件 
中 己 删 除 记 录 原 来 对 应 的 空间 。 

使 用 固定 大 小 的 散 列 表 作 为 索引 是 一 个 妥协 。 当 每 个 散 列 链 都 不 太 
长 时 ， 这 个 方法 能 保证 快速 地 访问 。 我 们 的 目的 是 能 够 快速 地 查找 任 一 
键 ， 同 时 又 不 使 用 太 复 杂 的 数据 结构 (如 B 树 或 动态 散 列 表 ) 。 动 态 散 
列表 的 优点 是 能 保证 仅 用 两 次 磁盘 存 取 束 能 找到 数据 记录 〈 详 见 
Litwin[1980] 或 Fagin 等 [1979]) 。B 树 能 够 用 《〈 已 排序 的 ) 键 的 顺序 来 过 
历数 据 库 〈 采 用 散 列 表 的 db_nextrec 函 数 就 做 不 到 这 一 点 ) 。 





















































20.5 集中 式 或 非 集 中 式 


当 有 多 个 进程 访问 同一 数据 库 时 ， 有 两 种 方法 可 实现 库 函 数 。 

(1) 集中 式 。 由 一 个 进程 作为 数据 库 管 理 者 ， 所 有 的 数据 库 访 问 
工作 由 此 进程 完成 。 其 他 进程 通过 IPC 机 制 与 此 中 心 进程 进行 联系 。 

(2) 非 集中 式 。 每 个 库 函 数 使 用 要 求 的 并 发 控制 COED ， 然 后 
发 起 自己 的 VO 函数 调用 。 

使 用 这 两 种 技术 的 数据 库 系统 都 有 。 如 果 有 适当 的 加 锁 例 程 ， 因 为 
避免 了 使 用 IPC， 那 么 非 集中 式 方 法 一 般 要 快 一 些 。 图 20-4 描 绘 了 集中 
式 方法 的 操作 。 

图 中 特意 表示 出 IPC 像 绝 大 多 数 UNIX 系 统 的 消息 传递 一 样 需要 经 过 
操作 系统 内 核 〈15.9 节 中 说 明 的 共享 存储 不 需要 这 种 经 过 内 核 的 复 
制 ) 。 在 集中 方式 下 ， 中 心 控制 进程 将 记录 读 出 ， 然 后 通过 IPC 机 制 将 
数据 传递 给 请 求 进程 。 这 是 这 种 设计 的 不 足 之 处 。 注 意 ， 集 中 式 数 据 库 
管理 进程 是 唯一 对 数据 库 文件 进行 1/O 操 作 的 进程 。 

集中 式 的 优点 是 能 够 根据 需要 来 对 操作 模式 进行 调整 。 例 如 ， 可 以 
通过 中 心 进程 给 不 同 的 进程 赋予 不 同 的 优先 级 ， 这 会 影响 到 中 心 进程 对 
IO 操作 的 调度 。 而 用 非 集 中 式 方 法 则 很 难 做 到 这 一 点 。 在 这 种 情况 
下 ， 只 能 依赖 于 操作 系统 内 核 的 磁盘 IO 调度 策略 和 加 锁 策 略 〈 例 如 ， 
当 3 个 进程 同时 等 待 一 个 即将 可 用 的 锁 时 ， 我 们 无 法 确定 哪个 进程 将 得 
到 这 个 锁 ) 。 

集中 式 方 法 的 另 一 个 优点 是 ， 恢 复 要 比 非 集中 式 方 法 容易 。 在 集中 
式 方法 中 ， 所 有 状态 信息 都 集中 存放 在 一 处 ， 所 以 如 知 杀 死 了 数据 库 进 
ee 0 

中 一 有 > Ae 
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图 20-4 集中 式 数据 库 访问 
图 20-5 描 绘 了 非 集中 式 方 法 ， 本 章 的 实现 就 是 采用 这 种 方法 。 
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索引 文件 数据 文件 


图 20-5 非 集 中 式 数 据 库 访问 
调用 数据 库 库 函数 执行 WO 的 用 户 进 程 是 合作 进程 ， 它 们 使 用 字 节 
范围 记录 锁 机 制 来 实现 并 发 控制 。 





20.6 并 发 


由 于 很 多 系统 的 实现 都 采用 两 个 文件 (一 个 索引 文件 和 一 个 数据 文 
件 ) 的 方法 ， 所 以 在 此 也 使 用 这 种 方法 ， 这 要 求 能 够 控制 对 两 个 文件 的 
加 锁 。 有 很 多 方法 可 用 来 对 两 个 文件 进行 加 锁 。 

1. FARE D 

最 简单 的 加 锁 方 法 是 将 这 两 个 文件 中 的 一 个 作为 整个 数据 库 的 锁 ， 
并 要 求 调用 者 在 对 数据 库 进 行 操作 前 必须 获得 这 个 锁 。 这 种 加 锁 方式 称 
为 粗 粒 度 锁 (coarse-grained locking) 。 例 如 ， 可 以 认为 一 个 进程 对 索引 
文件 的 0 字 节 加 了 读 锁 后 ， 才 能 读 整 个 数据 库 ; 一 个 进程 对 索引 文件 的 0 
字 节 加 了 写 锁 后 ， 了 驶 能 写 整 个 数据 库 。 可 以 使 用 UNIX 系 统 的 字 节 范围 
锁 机 制 来 控制 每 次 可 以 有 多 个 读 进 程 ， 而 只 能 有 一 个 写 进程 〈 见 图 14- 
3) 。db_fetch 和 db_nextrec 函 数 要 求 具 有 读 锁 ， 而 db_delete、db_store 和 
db_open 则 要 求 具有 写 锁 。 (db_open 要 求 写 锁 的 原因 是 如 果 要 创建 新 文 
件 的 话 ， 要 在 索引 文件 前 端 建立 空闲 区 链表 以 及 散 列 链表 。 ) 

粗 粒 度 锁 的 问题 是 它 限制 了 并 发 。 用 粗 粒 度 锁 时 ， 当 一 个 进程 同一 
ea 其 他 进程 无 法 访问 另 一 条 散 列 链 上 的 记 

2. 细 粒 度 锁 

AME (fine-grained locking) 的 方法 改进 了 粗 粒 度 锁 ， 提 供 了 更 
高 的 并 发 性 。 一 个 读 进 程 或 写 进程 在 操作 一 条 记录 前 必须 先 获得 此 记录 
所 在 散 列 链 的 读 锁 或 写 锁 。 一 条 散 列 链 人 允许 同时 有 多 个 读 进 程 ， 但 只 能 
有 一 个 写 进程 。 其 次 ， 一 个 写 进 程 在 访问 空闲 区 链表 CO db_delete 或 
db_store) 前 ， 必 须 获得 空 亲 区 链表 的 写 锁 。 最 后 ， 当 db_store 回 索引 文 
We 必须 获得 对 应 文件 相应 区 域 的 写 
> o 

期 望 细 粒 度 锁 能 比 粗 粒度 锁 能 提供 更 高 的 并 发 性 。20.9 节 将 给 出 一 
些 实际 的 比较 测试 结果 。20.8 市 给 出 了 细 粒 度 锁 实现 的 源 代码 ， 并 讨论 
锁 的 实现 细节 〔( 粗 粒度 锁 是 这 个 细 粒 度 锁 实现 的 简化 〉。 

在 源 代 码 中 ， 直 接 调用 了 read、readv、write 和 writev。 没 有 使 用 标 
准 WO 函 数 库 。 虽 然 使 用 标准 WO 疯 数 库 也 可 以 使 用 字 节 范围 锁 ， 但 是 需 
要 非常 复杂 的 绥 冲 管理 。 人 例如， 标准 IO 组 冲 区 的 数据 在 5 分 钟 之 前 被 另 
一 个 进程 修改 了 ， 那 么 我 们 束 不 希望 fgets 返 回 的 数据 是 10 分 钟 之 前 读 入 
标准 IO 绥 冲 区 的 数据 。 





























以 上 对 并 发 的 讨论 依据 的 是 对 数据 库 函 数 库 的 简单 需求 。 商 业 系 统 
般 有 更 多 的 需要 。 关 于 并 发 更 多 的 细节 可 以 参见 Data[2004] 的 第 16 
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20.7 构造 函数 库 


数据 库 的 函数 库 由 两 个 文件 构成 ， 一 个 公用 的 C 头 文件 以 及 一 个 C 
源 文件 。 我 们 可 以 用 下 列 命令 构造 一 个 静态 函数 库 。 
gcc -I../include -Wall -c db.c 
ar rsv libapue_db.a db.o 
因为 我 们 在 数据 库 函 数 库 中 使 用 了 一 些 我 们 自己 的 公共 函数 ， 所 以 
希望 与 libapue_db.a 相 连接 的 应 用 程序 也 需要 与 libapue. a 相 连接 。 
P 为 一 方面 ， 如 果 想 构建 数据 库 函 数 库 的 动态 共享 库 版 本 ， 可 使 用 下 
列 命 令 : 
gcc -I../include -Wall -fPIC -c db.c 
gcc -shared -WI,-soname,libapue_db.so.1 -o libapue_db.so.1 \ 
-L../lib -lapue -lc db.o 
构建 成 的 共享 库 libapue_db.so.1 需 放 置 在 动态 连接 程序 / 载 入 程序 
(dynamic linker/loader) 能 够 找到 的 一 个 公用 目录 中 。 还 可 以 将 共享 库 
放置 在 一 个 私有 目录 中 ， 修改 LD_LIBRARY_PATH 环境 变量 ， 使 动态 
连接 程序 / 载 入 程序 的 搜索 路 径 包 含 该 私有 目录 。 
在 不 同 平台 间 ， 构 建 共 i BE Pfam KRAMAR. 1 Ft A a aR 
在 带 GNU C 编 译 器 的 Linux 系 统 中 进行 的 。 
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ASAT fee PE BAN StS ACH Pe PRED RS, Fe Mk CF apue_db.hdt 
始 。 函 数 库 源 代码 以 及 调用 此 函数 库 的 所 有 应 用 程序 都 包含 这 一 头 文 


1 

从 此 处 开始 ， 实 例 程序 的 编排 方式 在 很 多 方面 与 前 面 的 实例 程序 编 
排 有 所 不 同 。 首 先 ， 因 为 源 代码 较 长 ， 为 此 加 了 行 号 ， 这 使 得 通过 行 写 
联系 相应 的 源 代 人 码 进行 讨论 更 加 方便 。 其 次 ， 对 源 代 码 的 说 明 紧 随 相 关 
源 代码 之 后 。 

这 种 风格 受到 John Lions 解 释 UNIX V6 操作 系统 源 代码 的 书 [Lions 
1977, 1996] 的 影响 ， 这 使 得 解释 说 明 大 量 源 代码 更 为 简易 。 

注意 ， 此 处 对 空 日 行 不 编号 。 虽 然 菜 些 工 具 〈《 如 ”pr(1)) 的 正常 操 
作 与 这 些 空白 行 是 有 关 的 ， 但 是 我 们 对 它们 并 无 任何 兴趣 。 

1 #ifndef _APUE_DB_H 

2 #define APUE_DB_H 

3 typedef void * DBHANDLE; 

4 DBHANDLE db_open(const char *, int, ...); 

5 void db_close( DBHANDLE); 

6 char *db_fetch(DBHANDLE, const char *); 

7 int db_storeeDBHANDLE, const char *, const char *, int); 

8 int db_deleteeDBHANDLE, const char *); 

9 void db_rewind(DBHANDLE); 

10 char *db_nextrec(DBHANDLE, char *); 

11 /* 

12 * Flags for db_store().13 */ 

14 #define DB_INSERT 1 /* insert new record only */ 

15 #define DB_REPLACE 2 /* replace existing record */ 

16 #define DB_STORE 3 /* replace or insert */ 

17 /* 

18 * Implementation limits. 

19 */ 

20 #define IDXLEN_MIN 6 /* key, sep, start, sep, length, \n */ 

21 #define IDXLEN_MAX 1024 /* arbitrary */ 

22 #define DATLEN MIN 2 /* data byte, newline */ 




















23 #define DATLEN_MAX 1024 /* arbitrary */ 

24 #endif /* _APUE_DB_H */ 

[1~3] 使 用 符 写 _APUE_DB FH 以 保证 只 包括 该 头 文 件 一 次 。 
DBHANDLE 类 型 表示 对 数据 库 的 一 个 有 效 引 用 ， 用 于 隔离 应 用 程序 和 
数据 库 的 实现 细节 。 将 此 技术 与 标准 WO 库 向 应 用 程序 提供 FILE 结 构 相 
比较 ， 两 者 相似 。 

[4 一 10] 接着 ， 声 明了 数据 库 函 数 库 公 有 函数 的 原型 。 因 为 使 用 函 
的 应 用 程序 包括 了 此 头 文 件 ， 所 以 这 里 不 再 声明 函数 库 私 有 函数 的 
re AY 

[11~24] 定义 了 可 以 传送 给 db_store 函数 的 合法 标志 。 其 后 是 实现 
的 基本 限制 。 如 果 希 望 文 持 更 大 的 数据 库 ， 可 以 更 改 这 些 限制 。 

最 小 索引 记录 长 度 由 IDXLEN_MIN 指 定 。 这 表示 1 字 节 键 、1 字 节 分 
阳 符 、1 字 节 起 始 偏 移 量 ， 男 一 个 1 字 节 分 隅 符 、1 字 节 长 度 和 终止 换行 
符 。【〔 回 忆 图 20-2 中 索引 记录 的 格式 。) 一 条 索引 记录 通常 长 于 
IDXLEN_MIN 字 节 ， 这 只 是 最 小 长 度 。 

下 一 个 文件 是 db.c， 它 是 库 函 数 的 C 源 文件 。 为 简化 起 见 ， 将 所 有 
函数 都 放 在 一 个 文件 中 。 这 样 处 理 的 优点 是 只 要 将 私有 函数 声明 为 
static， 就 可 对 外 将 它 隐 蔽 起 来 。 

1 #include "apue.h" 

2 #include "apue_db.h" 

3 #include <fcntl.h> /* open & db_open flags */ 

4 #include <stdarg.h> 

5 #include <errno.h> 

6 #include <sys/uio.h> /* struct iovec */ 

Lie 

8 * Internal index file constants. 

9 * These are used to construct records in the 

10 * index file and data file. 

11 */ 

12 #define IDXLEN_SZ 4  /* index record length (ASCII 
chars) */ 











13 #define SEP ':'  /* separator char in index record */ 
14 #define SPACE ''  /* space character */ 

15 #define NEWLINE \n' /* newline character */ 

16 /* 


17 * The following definitions are for hash chains and free 
18 * list chain in the index file. 


19 */ 

20 #define PTR_SZ 7 /* size of ptr field in hash chain */ 
21 #define PTR MAX 999999 /* max file offset = 10**PTR_SZ - 1 */ 
22 #define NHASH_DEF 137 /* default hash table size */ 

23 #define FREE OFF 0 /* free list offset in index file */ 
24 #define HASH OFF PTR_SZ /* hash table offset in index file 


*/ 

25 typedef unsigned long DBHASH; /* hash values */ 

26 typedef unsigned long COUNT; /* unsigned counter */ 

[1~6] 使 用 了 一 些 私有 函数 库 中 的 函数 ， 所 以 程序 中 包括 了 
apue.h。 当 然 ，apue.h 也 包括 知 干 标准 头 文 件 ， 包 括 <stdio.h> 和 


<unistd.h> 。 因 为 db_open 函数 使 用 由 <stdarg.h> 定 义 的 可 变 参 数 函 数 ， 
所 以 程序 中 也 包括 了 <stdarg.h>。 

[7 一 26] 索引 记录 的 长 度 说 明 为 IDXLEN_SZ。 我 们 用 某 些 字符 (如 
冒号 、 换 行 符 ) 作为 数据 库 中 的 分 隅 符 。 当 删除 一 记录 时 ， 在 其 中 全 部 
填 入 空格 符 。 

其 中 一 些 定义 为 常量 的 值 也 可 定义 为 变量 ， 只 是 会 使 实现 复 森 一 
些 。 例 如 ， 设 定 散 列表 的 大 小 为 ”137 ”记录 项 ， 也 许 更 好 的 方法 是 让 
db_open 的 调用 者 根据 预期 的 数据 库 大 小 通过 参数 来 设 定 这 个 值 ， 然 后 
将 该 值 存 在 索引 文件 的 最 前 面 。 

27 /* 

28 *Library's private representation of the database. 

29 */ 

30 typedef struct { 

31 int idxfd; /* fd for index file */ 

32 int datfd; /* fd for data file */ 











33 char *idxbuf; /* malloc'ed buffer for index record */ 

34 char *datbuf; /* malloc'ed buffer for data record*/ 

35 char *name; /* name db was opened under */ 

36 off t idxoff; /* offset in index file of index record */ 

37 /* key is at (idxoff + PTR_SZ + 
IDXLEN_SZ) */ 

38 size_t idxlen; /* length of index record */ 


39 /* excludes IDXLEN_SZ bytes at front of record */ 
40 /* includes newline at end of index record */ 

41 off_t datoff; /* offset in data file of data record */ 
42 size_t datlen; /* length of data record */ 


43 /* includes newline at end */ 

44 off_t ptrval; /* contents of chain ptr in index record */ 

45 off_t ptroff; /* chain ptr offset pointing to this idx record */ 
46 off_t chainoff; /* offset of hash chain for this index record */ 
47 off_t hashoff; /* offset in index file of hash table */ 

48 DBHASH nhash; /* current hash table size */ 

49 COUNT cnt delok; /* delete OK */ 

50 COUNT cnt delerr; /* delete error */ 

51 COUNT cnt fetchok; /* fetch OK */ 

52 COUNT cnt fetcherr; /* fetch error */ 


53 COUNT cnt_nextrec; /* nextrec */ 

54 COUNT  cnt_stor1; /* store: DB_INSERT, no empty, 
appended */ 

55 COUNT cnt stor2; /* store: DB INSERT, found 
empty, reused */ 

56 COUNT nt stor3; /* store: DB_REPLACE, diff len, 
appended */ 

57 COUNT cnt stor4; /* store: DB_REPLACE, same len, 
overwrote */ 

58 COUNT nt storerr; /* store error */ 

59 } DB; 


[27~48] 在 DB 结构 中 记录 一 个 打开 数据 库 的 所 有 信息 。db_open 
函数 返回 DB 结构 的 指针 DBHANDLE 值 。 这 个 指针 被 用 于 其 他 所 有 函 
数 ， 而 该 结构 本 里 则 不 面 同调 用 者 。 

因为 在 数据 库 中 以 ASCII 形式 存放 指针 和 长 度 ， 所 以 将 这 些 转换 为 
数字 值 ， 并 存放 在 DB 结构 中 。 也 存放 散 列 表 长 度 ， 虽 然 一 般 而 言 ， 这 
是 定 长 的 ， 但 也 有 可 能 为 加 强 该 函数 库 ， 人 允许 调用 者 在 创建 数据 库 时 指 
定 该 长 度 〈 见 习题 20.7) 。 

[49 一 59] DB 结构 的 最 后 10 个 字段 对 成 功 和 不 成 功 的 操作 进行 计 
数 。 如 果 想 要 分 析 数 据 库 的 性 能 ， 则 可 编写 一 个 函数 返回 这 些 统计 值 。 
但 目前 我 们 仅 保 持 这 些 计 数 器 ， 并 未 编写 此 种 函数 。 

60 /* 

61 *Internal functions. 

62 */ 

63 static DB *_db_alloc(int); 

64 Static void _db_dodelete(DB *); 

65 static int _db_find_and_lock(DB *, const char *, int); 


66 static int _db_findfree(DB *, int, int); 

67 static void _db_free(DB *); 

68 static DBHASH _db_hash(DB *, const char *); 

69 Static char *_db_readdat(DB *); 

70 static off_t _db_readidx(DB *, off_t); 

71 static off_t _db_readptr(DB *, off_t); 

72 static void _db_writedat(DB *, const char *, off_t, int); 

73 static void _db_writeidx(DB *, const char *, off_t, int, off_t); 
74 static void _db_writeptr(DB *, off_t, off_t); 


75 j= 

76 *Open or create a database. Same arguments as open(2). 
77 5 

78 DBHANDLE 

79 db_open(const char *pathname, int oflag, ...) 

80 

81 DB *db; 

82 int len, mode; 

83 size_t j; 

84 char asciiptr[PTR_SZ + 1], 

85 hash[((NHASH_DEF + 1) * PTR_SZ + 2]; 
86 /* +2 for newline and null */ 

87 struct stat statbuff; 

88 /* 

89 * Allocate a DB structure, and the buffers it needs. 

90 */ 


91 len = strlen(pathname); 

92 if ((db = _db_alloc(len)) == NULL) 

93 err_dump("db_open: _db_alloc error for DB"); 

[60~74] 选择 用 db_ 开 头 来 命名 用 户 可 调用 《公有 ) 的 所 有 函数 ， 
用 _db_ 开头 来 命名 内 部 《私有 ) 函数 。 公 有 函数 在 函数 库 头 文件 
apue_db.h 中 声明 。 内 部 函数 声明 为 static， 所 以 只 有 同一 文件 中 的 其 他 
函数 才能 调用 它们 (该 文件 包含 函数 库 实现 ) 。 

[75~93] db_open 函 数 的 参数 与 open(2) 相 同 。 如 果 调 用 者 想 要 创建 
数据 库 文件 ， 那 么 用 可 选择 的 第 三 个 参数 指定 文件 权限 。db_open 函 数 
打开 索引 文件 和 数据 文件 ， 在 必要 时 初始 化 索引 文件 。 该 函数 调用 

_db_alloc 来 为 DB 结构 分 配 空间 ， 并 初始 化 此 结构 。 
94 db->nhash = NHASH DEF;/* hash table size */ 





95 db->hashoff = HASH_OFF; /* offset in index file of hash 
table */ 


96 strcpy(db->name, pathname); 

97 strcat(db->name, ".idx"); 

98 if (oflag & O_CREAT) { 

99 va_list ap; 

100 va_start(ap, oflag); 

101 mode = va_arg(ap, int); 

102 va_end(ap); 

103 /* 

104 * Open index file and data file. 
105 */ 


106 db->idxfd = open(db->name, oflag, mode); 

107 strcpy(db->name + len, ".dat"); 

108 db->datfd = open(db->name, oflag, mode); 

109 } else { 

110 /* 

111 * Open index file and data file. 

112 */ 

113 db->idxfd = open(db->name, oflag); 

114 strcpy(db->name + len, ".dat"); 

115 db->datfd = open(db->name, oflag); 

116 } 

117 if (db->idxfd < 0 || db->datfd < 0) { 

118 _db_free(db); 

119 return(NULL); 

120 } 

[94~97] 继续 初始 化 DB 结构 。 调 用 者 传 入 的 路 径 名 指定 数据 库 文 
件 名 的 前 绥 。 追 加 后 绥 .idx 以 构成 数据 库 索 引文 件 的 名 字 。 

[98 一 108] 如 果 调 用 者 想 要 创建 数据 库 文件 ， 那 么 使 用 <stdarg.h> 中 
的 可 变 参数 函数 以 找到 可 选 的 第 三 个 参数 。 然 后 ， 使 用 open 创建 并 打 
开 索 引文 件 和 数据 文件 。 注 意 ， 数 据 文件 的 文件 名 以 索引 文件 同样 的 前 
级 开始 ， 但 后 级 为 .dat。 

[109 一 116] 如 果 调 用 者 没有 指定 O_CREAT 标 志 ， 那 么 正在 打开 已 
有 的 数据 库 文 件 。 此 时 ， 只 用 两 个 参数 调用 open。 

[117~120] 如 果 在 打开 或 创建 任 一 数据 库 文件 时 出 错 ， 则 调用 
_db_free 清 除 DB 结 构 ， 然 后 对 调用 者 返回 NULL。 如 果 一 个 文件 open 成 





功 而 另 一 个 失败 ，_db_free 将 关闭 该 打开 文件 描述 符 。 我 们 很 快 就 会 见 
到 这 一 操作 。 
121 if ((oflag & (O_CREAT | O_TRUNC)) == (O_CREAT | 


O_TRUNC)) { 
122 /* 
123 * If the database was created, we have to initialize 
124 * it. Write lock the entire file so that we can stat 
125 * it, check its size, and initialize it, atomically. 
126 */ 
127 if (writew_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 
128 err_dump("db_open: writew_lock error"); 
129 if (fstat(db->idxfd, &statbuff) < 0) 
130 err_sys("db_open: fstat error"); 
131 if (statbuff.st_size == 0) { 
132 /* 
133 * We have to build a list of (NHASH_DEF + 1) 
chain 
134 * ptrs with a value of 0. The +1 is for the free 
135 * list pointer that precedes the hash table. 
136 */ 
137 sprintf(asciiptr, "%*d", PTR_SZ, 0); 


[121~130] 如 果 正 在 建立 数据 库 ， 则 必须 正确 地 加 锁 。 考 虑 两 个 进 
程 试 图 同时 建立 同一 个 数据 库 的 情况 。 第 一 个 进程 运行 到 调用 fstat， 并 
且 在 fstat 返 回 后 被 内 核 阻 塞 。 

这 时 第 二 个 进程 调用 db_open， 发 现 索 引文 件 的 长 度 为 0， 然 后 初始 
化 空闲 链表 和 散 列 链表 。 第 二 个 进程 继续 运行 ， 同 数据 库 中 写 入 了 一 条 
记录 。 这 时 第 二 个 进程 被 阻塞 ， 第 一 个 进程 在 调用 fstat 后 立刻 继续 运 
行 ， 它 发 现 索 引文 件 的 长 度 为 0 (因为 第 一 个 进程 调用 fstat 在 前 ， 然 后 
第 二 个 进程 再 初始 化 索引 文件 ) ， 所 以 第 一 个 进程 重新 初始 化 空闲 链表 
和 散 列 链表 ， 第 二 个 进程 写 入 的 记录 就 被 抹 去 了 。 

避免 发 生 这 种 情况 的 方法 是 进行 加 锁 ， 为 此 可 以 使 用 14.3 节 中 的 
readw_lock、writew_lock 和 un_lock 这 3 个 宏 。 

[131 一 137] 如 果 索 引文 件 的 长 度 是 0， 那 么 这 是 刚刚 被 创建 的 ， 所 
以 需要 初始 化 它 所 包 售 的 空闲 列表 指针 和 散 列 链 指针 。 注 意 ， 使 用 格式 
字符 串 %*d 将 数据 库 指针 从 整 型 转换 为 ASCII 字 符 串 。 (在 _db_writeidx 
和 _db_writeptr 中 还 将 使 用 这 种 格式 字符 串 。) 这 一 格式 告诉 sprintf 取 
PTR_SZ 参 数 ， 用 它 作为 下 一 个 参数 的 最 小 字段 宽度 ， 在 此 例 中 ， 它 是 











0《〈 此 处 ， 因 为 正在 创建 一 数据 库 ， 所 以 将 指针 初始 化 为 0) 。 其 作用 是 
强迫 创建 的 字符 串 至 少 包含 PTR_SZ 个 字符 “〈 在 左边 用 空格 充填 ) 。 在 
db_writeidx 和 _db_writeptr 中 ， 将 传送 一 个 非 0 指 针 值 ， 但 是 首先 将 验证 


指针 值 不 大 于 








PTR_SZ(7) 个 字符 。 


138 
139 
140 
141 
142 
143 
144 
error"); 

145 
146 
147 
148 
149 
150 
151 } 
152 /* 


hash[0] = 0; 

for (i = 0; i < NHASH_DEF + 1; i++) 
strcat(hash, asciiptr); 

strcat(hash, "\n"); 

i = strlen(hash); 

if (write(db->idxfd, hash, i) != i) 


err_dump("db_open: index file init write 


} 
if (un_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 
err_dump("db_open: un_lock error"); 
} 
db_rewind(db); 
return(db); 


153 * Allocate & initialize a DB structure and its buffers. 


154 */ 


155 static DB * 
156 _db_alloc(int namelen) 


157 { 
158 
159 
160 
161 
162 
163 
164 
165 
166 


DB *db; 

/* 

* Use calloc, to initialize the structure to zero. 
*/ 


if ((db = calloc(1, sizeof(DB))) == NULL) 
err_dump("_db_alloc: calloc error for DB"); 

db->idxfd = db->datfd = -1; /* descriptors */ 

/* 

* Allocate room for the name. 


167 * +5 for ".idx" or ".dat" plus null at end. 


168 */ 


PTR_MAX， 以 保证 写 入 数据 库 的 指针 字符 串 恰 好 为 


169 if ((db->name = malloc(namelen + 5)) == NULL) 

170 err_dump("_db_alloc: malloc error for name"); 

[138~ 151] 继续 初始 化 新 创建 的 数据 库 。 构 造 散 列表 ， 将 它 写 到 过 
引文 件 中 。 然 后 ， 解 锁 索 引文 件 ， 重 置 数据 库 文 件 指 针 ， 返 回 DB 结构 
指针 作为 句柄 ， 以 便 调 用 者 以 后 用 于 其 他 数据 库 函 数 。 

[152~164] db_open 调 用 函数 _db_alloc 为 DB 结构 分 配 空间 ， 包 括 一 
个 索引 缓冲 区 和 一 个 数据 缓冲 区 。 用 calloc 分 配 存储 区 来 存放 DB 结 
构 ， 并 将 该 存储 区 各 存储 单元 全 部 初始 化 为 0。 这 产生 了 一 个 副作用 ， 
也 就 是 将 数据 库 文件 描述 符 也 设置 为 0， 为 此 需 将 它们 重新 设置 为 -1， 
表示 它们 至 此 还 不 是 有 效 的 。 

[165 一 170] 分 配 空间 以 存放 数据 库 索 引文 件 和 数据 文件 的 名 字 。 如 
db _open 中 所 说 明 的 那样 ， 更 改 它们 的 名 学 后 级 以 便 引 用 索引 文件 或 数 
据 文 件 。 

171 /* 

172 * Allocate an index buffer and a data buffer. 

173 * +2 for newline and null at end. 

174 */ 

175 if ((db->idxbuf = malloc(IDXLEN MAX + 2)) == NULL) 

176 err_dump("_db_alloc: malloc error for index buffer"); 

177 if ((db->datbuf = malloc(DATLEN_MAX + 2)) == NULL) 

178 err_dump("_db_alloc: malloc error for data buffer"); 

179 return(db); 

180 } 

181 /* 

182 * Relinquish access to the database. 

183 */ 

184 void 

185 db close(DBHANDLE h) 

186 { 

187 _db_free((DB *)h); /* closes fds, free buffers & struct */ 
188 

189 /* 

190 * Free up a DB structure, and all the malloc'ed buffers it 

191 * may point to. Also close the file descriptors if still open. 

192 */ 

193 static void 

194 _db_free(DB *db) 


195 { 
196 if (db->idxfd >= 0) 


197 close(db->idxfd); 
198 if (db->datfd >= 0) 
199 close(db->datfd); 





[171~180] ABS SCHEMA SCPE FX op TE. FR | HK 
和 数据 缓冲 区 的 大 小 在 apue_db.h ”中 定义 。 可 以 通过 让 这 些 缓冲 区 按 需 
要 动态 扩张 来 增强 数据 库 函 数 库 。 其 方法 可 以 是 记录 这 两 个 缓冲 区 的 大 
小 ， 然 后 在 需要 更 大 的 缓冲 区 时 调用 realloc。 最 后 ， 返 回 指 回 已 分 配 到 
的 DB 结构 的 指针 。 

[181~188] db_close 函 数 只 是 一 个 包装 ， 它 将 数据 库 句 柄 强制 类 型 
转换 为 DB 结构 的 指针 ， 将 它 传送 给 _db_free 函 数 ， 由 该 函数 释放 资源 以 
及 DB 结构 。 

[189~199] db_open 在 打开 索引 文件 和 数据 文件 时 如 果 发 生 错误 ， 
会 调用 _db_free 函 数 释 放 资 源 。 应 用 程序 在 结束 对 数据 库 的 使 用 后 ， 
db_close 也 会 调用 _db_free。 如 果 数 据 库 索引 文件 的 文件 描述 符 有 效 ， 那 
么 关闭 该 文件 。 对 数据 文件 描述 符 也 进行 同样 处 理 。 (回忆 在 _db_alloc 
中 分 配 一 个 新 的 DB 结构 时 ， 将 每 个 文件 描述 符 都 初始 化 为 -1。 如 果 不 
ee E E E 
RAE. ) 

200 if (db->idxbuf != NULL) 





201 free(db->idxbuf); 
202 if (db->datbuf != NULL) 
203 free(db->datbuf); 
204 if (db->name != NULL) 
205 free(db->name); 
206 free(db); 

207 } 

208 /* 


209 * Fetch a record. Return a pointer to the null-terminated data. 
210 */ 


211 char * 

212 db_fetch(DBHANDLE h, const char *key) 
213 { 

214 DB *db = h; 


215 char *ptr; 
216 if (_db_find_and_lock(db, key, 0) < 0) { 


217 ptr = NULL; /* error, record not found */ 


218 db->cnt_fetcherr++; 

219 } else { 

220 ptr =_db_readdat(db); /* return pointer to data */ 
221 db->cnt_fetchok++; 

222 } 

223 /* 

224 * Unlock the hash chain that _db_find_and_lock locked. 
225 *7 

226 if (un_lock(db->idxfd, db->chainoff, SEEK_SET, 1) < 0) 
227 err_dump("db_fetch: un_lock error"); 

228 return(ptr); 

229 } 


[200~207] 接着 ， 释 放 动 态 分 配 的 缓冲 区 。 可 以 安全 地 将 一 个 空 指 
针 传递 给 free 函数 ， 这 样 也 就 无 需 事 先 检 碍 每 个 缓冲 区 指针 的 值 ， 但 是 
我 们 认为 只 释放 已 分 配 的 对 象 是 一 种 较 好 的 编程 风格 。 《并非 所 有 释放 
程序 都 像 free 那样 容忍 差错 。) 最 后 ， 释 放 DB 绪 构 占 用 的 存储 区 。 

[208 一 218] 函数 db_fetch 根 据 给 定 的 键 来 读 取 一 条 记录 。 饭 调用 
_db_find_and_lock 在 数据 库 中 查找 记录 。 若 不 能 找到 该 记录 ， 则 将 返回 
E (ptr) 设置 为 NULL， 将 不 成 功 的 记录 搜索 计数 器 值 加 ”1。 因 为 从 
_db_find_and_lock 返回 时 ， 数 据 库 索 引文 件 是 加 锁 的 ， 所 以 先 要 解锁 ， 
然后 再 返回 。 

[219 一 229] 如 果 找 到 了 记录 ， 调 用 _db_readdat 读 相应 的 数据 记录 ， 
并 将 成 功 记录 搜索 计数 器 值 加 1。 在 返回 前 ， 调 用 un_lock 对 索引 文件 解 
锁 。 然 后 ， 返 回 所 找到 记录 的 指针 (如 果 没 有 找到 所 需 记录 ， 则 返回 
NULL) 。 

230 /* 

231 * Find the specified record. Called by db_delete, db_fetch, 

232 * and db_store. Returns with the hash chain locked.233 */ 

234 static int 

235 _db_find_and_lock(DB *db, const char *key, int writelock)236 { 

237 off_t offset, nextoffset; 




















238 /* 

239 * Calculate the hash value for this key, then calculate the 
240 * byte offset of corresponding chain ptr in hash table. 
241 * This is where our search starts. First we calculate the 


242 * offset in the hash table for this key. 


243 #7 
244 db->chainoff = (_db_hash(db, key) * PTR_SZ) + db->hashoff; 
245 db->ptroff = db->chainoff; 


246 /* 

247 * We lock the hash chain here. The caller must unlock it 

248 * when done. Note we lock and unlock only the first byte. 

249 rj 

250 if (writelock) { 

251 if (writew_lock(db->idxfd, db->chainoff, SEEK_SET, 
1) <0) 

252 err_dump("_db_find_and_lock: writew_lock 
error"); 

253 } else { 

254 if (readw_lock(db->idxfd, db->chainoff, SEEK_SET, 1) 
<0) 

255 err_dump("_db_find_and_lock: readw_lock 
error"); 

256 } 

257 /* 

258 * Get the offset in the index file of first record 

259 * on the hash chain (can be 0). 

260 */ 


261 offset = _db_readptr(db, db->ptroff); 

[230~237] _db_find_and_lock 函数 在 函数 库 内 部 用 于 按 给 定 的 键 查 
找 记录 。 在 搜索 记录 时 ， 如 果 想 在 索引 文件 上 加 一 把 写 锁 ， 则 将 
writelock 参 数 设 置 为 非 0 值 。 如 果 将 writelock 参 数 设置 为 0， 则 在 搜索 记 
录 时 ， 在 索引 文件 上 加 读 锁 。 

[238 一 256] 在 _db_find_and_lock 中 准备 遍历 散 列 链 。 将 键 转换 为 散 
列 值 ， 用 其 计算 在 文件 中 相应 散 列 链 的 起 始 地 址 〈chainoff) 。 在 遍历 
散 列 链 前 ， 等 待 获得 锁 。 注 意 ， 只 锁 该 散 列 链 开始 处 的 第 1 个 字 节 。 这 
种 方式 允许 多 个 进程 同时 搜索 不 同 的 散 列 链 ， 因 此 增加 了 并 发 性 。 

[257~261] 调用 _db_readptr 读 散 列 链 中 的 第 一 个 指针 。 如 有 果 该 函数 
返回 90， 则 该 散 列 链 为 空 。 

262 while (offset != 0) { 

263 nextoffset = _db_readidx(db, offset); 

264 让 (strcmp(db->idxbuf, key) == 0) 

265 break; /* found a match */ 














266 db->ptroff = offset; /* offset of this (unequal) record */ 


267 offset = nextoffset; /* next one to compare */ 
268 } 

269 /* 

270 * offset == 0 on error (record not found). 

271 */ 

272 return(offset == 0 ? -1 : 0); 

273 } 

274 /* 

275 * Calculate the hash value for a key. 

276 */ 

277 static DBHASH 

278 _db_hash(DB *db, const char *key) 

279 { 

280 DBHASH hval = 0; 

281 char C; 

282 int 1; 

283 for (i = 1; (c = *key++) != 0; i++) 

284 hval += c * i; /* ascii char times its 1-based index */ 
285 return(hval % db->nhash); 

286 } 





[262 ~~ 268] while da A BEF AERA Slide, FEC. 
调用 函数 _db_readidx 读 取 每 条 索引 记录 。 它 将 当前 记录 的 键 填 入 DB 结 
构 中 的 idxbuf 字段 。 如 果 _db_readidx 返 回 0， 则 已 到 达 散 列 链 的 最 后 一 
记录 项 。 

[269~273] 如 果 在 循环 后 ，offset 为 0， 说 明 已 达到 散 列 链 末 端 而 且 
没有 找到 匹配 键 ， 于 是 返回 -1。 否 则 ， 找 到 了 匹配 记录 (用 break 语 人 句 
退出 了 循环 ) ， 所 以 返回 0 表示 成 功 。 此 时 ，ptroff 字 段 包 含 前 一 索引 记 
录 的 地 址 ，datoff 包 含 数 据 记录 的 地 址 ， datlen 是 数据 记录 的 长 度 。 当 沿 
着 散 列 链 进行 般 历 时 ， 必 须 始终 保存 当前 索引 记录 的 前 一 条 索引 记录 ， 
其 中 有 一 个 指针 指向 当前 索引 记录 。 这 样 做 在 删除 一 条 记录 时 很 有 用 ， 
因为 必须 修改 当前 索引 记录 的 前 一 条 记录 的 链 指针 以 删除 当前 记录 。 

[274 一 286] _db_hash 根 据 给 定 的 键 计 算 散 列 值 。 它 将 键 中 的 每 一 个 
ASCII 字 符 乘 以 这 个 字符 在 字符 串 中 以 1 开始 的 索引 号 ， 将 这 些 结果 加 
起 来 ， 除 以 散 列 表 记 录 项 数 ， 将 余数 作为 这 个 键 的 散 列 值 。 回 忆 散 列表 
记录 项 数 是 137， 它 是 一 个 素数 ， 按 Knuth[1998]， 素 数 散 列 通 芝 能 提供 
恨 好 的 分 布 特性 。 














287 /* 

288 * Read a chain ptr field from anywhere in the index file: 
289 * the free list pointer, a hash table chain ptr, or an 

290 * index record chain ptr. 

291 */ 

292 static off_t 

293 _db_readptr(DB *db, off_t offset) 

294 { 

295 char asciiptr[ PTR_SZ + 1]; 

296 if (lseek(db->idxfd, offset, SEEK_SET) == -1) 


297 err_dump("_db_readptr: lseek error to ptr field"); 
298 if (read(db->idxfd, asciiptr, PTR_SZ) != PTR_SZ) 
299 err_dump("_db_readptr: read error of ptr field"); 
300 asciiptr| PTR_SZ] = 0; /* null terminate */ 
301 return(atol(asciiptr)); 

302 } 

303 /* 


304 * Read the next index record. We start at the specified offset 
305 * in the index file. We read the index record into db->idxbuf 
306 * and replace the separators with null bytes. If all is OK we 
307 * set db->datoff and db->datlen to the offset and length of the 
308 * corresponding data record in the data file. 

309 */ 

310 static off_t 

311 _db_readidx(DB *db, off_t offset) 


312 { 

313 ssize_t i; 

314 char *ptr1, *ptr2; 

315 char asciiptr[PTR_SZ + 1], asciilen[IDXLEN_SZ 
+ 1); 

316 struct iovec iov[2]; 





[287~302] ”_db_readptr 疯 数 读 取 以 下 3 种 不 同 链表 指针 中 的 任意 一 
PH: (a) 索引 文件 最 开始 处 指向 空闲 链表 中 第 一 个 索引 记录 的 指针 ， 
Cb) 散 列表 中 指向 散 列 链 的 第 一 条 索引 记录 的 指针 ，〈c) 存放 在 每 条 
索引 记录 开始 处 、 指 向 下 一 条 记录 的 指针 〈 这 里 的 索引 记录 既 可 以 处 于 
一 条 散 列 链表 中 ， 也 可 以 处 于 空闲 链表 中 ) 。 返 回 前 ， 将 指针 从 ASCII 
形式 转换 为 长 整 型 。 此 函数 不 进行 任何 加 锁 操 作 ， 所 以 其 调用 者 应 事先 








做 好 必要 的 加 锁 。 
[303~316] _db_readidx 郧 数 用 于 从 索引 文件 的 指定 偏 移 量 处 读 取 索 
引 记 录 。 如 果 成 功 ， 该 函数 将 返回 链表 中 下 一 条 记录 的 偏 移 量 。 该 函数 


还 填充 “DB 

















结构 的 许多 字段 :idxoff 包 含 索 引文 件 中 当前 记录 的 偏 移 


量 ，ptrval 包 含 在 散 列 链表 中 下 一 个 索引 项 的 偏 移 量 ，idxlen 包 含 当前 索 


引 记录 的 长 度 ， 





idxbuf 包 含 实 际 索 引 记 录 ， ”datoff 包 含 数 据 文件 中 该 记 


录 的 偏 移 量 ，datlen 包 含 该 数据 记录 的 长 度 。 


317 
318 
319 
320 
321 
322 
323 
324 
325 
326 
327 
328 
329 
330 
331 
332 
333 
334 
IDXLEN_SZ) { 
335 
336 
337 
338 
339 
340 
341 
342 
343 
ay 
344 


/* 
* Position index file and record the offset. db_nextrec 
* calls us with offset==0, meaning read from current offset. 
* We still need to call lseek to record the current offset. 
F 
if ((db->idxoff = lseek(db->idxfd, offset, 
offset == 0 ? SEEK_CUR : SEEK_SET)) == -1) 
err_dump("_db_readidx: lseek error"); 
/* 
* Read the ascii chain ptr and the ascii length at 
* the front of the index record. This tells us the 
* remaining size of the index record. 
*/ 
iov[0].iov_base = asciiptr; 
iov[O].iov_len = PTR_SZ; 
iov[1].iov_base = asciilen; 
iov[1].iov_len =IDXLEN_SZ; 
if (G@ = readv(db->idxfd, &iov[0], 2)) != PTR_SZ + 


if (i == 0 && offset == 0) 
return(-1); /* EOF for db_nextrec */ 
err_dump("_db_readidx: readv error of index record"); 


} 

/* 

* This is our return value; always >= 0. 

*/ 

asciiptr[PTR_SZ] = 0; /* null terminate */ 


db->ptrval =  toll(asciiptr); /* offset of next key in chain 


asciilen[IDXLEN_SZ] = 0; /* null terminate */ 


345 if ((db->idxlen = atoi(asciilen)) < IDXLEN_MIN || 

346 db->idxlen > IDXLEN_MAX) 

347 err_dump("_db_readidx: invalid length"); 

[317~324] 按 调 用 者 提供 的 参数 查找 索引 文件 偏 移 量 。 在 DB 结构 
中 记录 该 偏 移 量 ， 为 此 即使 调用 者 想 要 在 当 HCI WE Wb ok ( 设 
置 offset 为 0) ， 仍 需 要 调用 lseek 以 确定 当前 偏 移 量 。 因 为 在 索引 文件 
中 ， 索 引 记 录 决 不 会 存放 在 仿 移 量 为 0 处， 所 以 可 以 放 心地 使 用 0 表 
示 “ 从 当前 偏 移 量 处 读 ”。 

[325 一 338] 调用 readv 读 在 索引 记录 开始 处 的 两 个 定 长 字段 : 指 同 下 
ee (余下 部 分 是 变 长 
J) 。 

[339~347] “将 下 一 记录 的 偏 移 量 转换 为 整 型 ， 并 存放 到 ptrval 字 段 
中 《这 将 被 用 作 此 函数 的 返回 值 ) 。 然 后 将 索引 记录 的 长 度 转换 为 整 
型 ， 并 存放 到 idxlen 字 段 中 。 

















348 /* 

349 * Now read the actual index record. We read it into the key 

350 * buffer that we malloced when we opened the database. 

351 */ 

352 if (i = read(db->idxfd, db->idxbuf, db->idxlen)) != db- 
>idxlen) 

353 err_dump("_db_readidx: read error of index record"); 

354 if (db->idxbuf[db->idxlen-1] != NEWLINE) /* sanity 
check */ 

355 err_dump("_db_readidx: missing newline"); 

356 db->idxbuf[db->idxlen-1] = 0; /* replace newline with 
null */ 

357 /* 

358 * Find the separators in the index record. 

359 7 

360 if ((ptr1 = strchr(db->idxbuf, SEP)) == NULL) 

361 err_dump("_db_readidx: missing first separator"); 

362 *ptrl++ = 0; /* replace SEP 
with null */ 

363 if ((ptr2 = strchr(ptr1, SEP)) == NULL) 

364 err_dump("_db_readidx: missing second separator"); 

365 *ptr2++ = 0; /* replace SEP 


with null */ 


366 if (strchr(ptr2, SEP) != NULL) 


367 err_dump("_db_readidx: too many separators"); 

368 hs 

369 * Get the starting offset and length of the data record. 

370 */ 

371 if ((db->datoff = atol(ptr1)) < 0) 

372 err_dump("_db_readidx: starting offset < 0"); 

373 if ((db->datlen = atol(ptr2)) <= 0 || db->datlen > 
DATLEN_MAX) 

374 err_dump("_db_readidx: invalid length"); 

375 return(db->ptrval); /* return offset of next key 
in chain */ 

376 } 


[348 一 356] 将 索引 记录 的 变 长 部 分 谈 入 DB 结构 中 的 idxbuf 字 段 。 该 
记录 应 以 换行 符 结 尾 。 

用 null 字 符 代 蔡 换行 符 。 如 果 索 引文 件 已 遭 破 坏 ， 那 么 调用 
err_dump 函 数 终 目 core 文件 。 

[357~367] 将 索引 记录 划分 成 3 个 字段 : 键 、 对 应 数据 记录 的 偏 移 
量 和 数据 记录 的 长 上 度 。 

strchr 函数 在 给 定 字 符 串 中 找到 第 一 个 指定 字符 。 这 里 ， 我 们 要 寻 
找 的 是 记录 中 分 隅 字段 的 字符 〈SEP， 此 处 定义 为 冒号 ) 。 

[368 一 376] 将 数据 记录 偏 移 量 和 数据 记录 长 度 转换 为 整 型 ， 并 将 它 
们 存放 在 DB 结构 中 。 然 后 ， 返 回 在 散 列 链 中 下 一 条 记录 的 偏 移 量 。 注 
意 ， 我 们 并 不 读数 据 记 录 ， 这 由 调用 者 自己 完成 。 例 如 ， 在 db_fetch 
中 ， 在 _db_find_and_lock 按 键 找到 索引 记录 前 是 不 读 取 数据 记录 的 。 

377 /* 

378 * Read the current data record into the data buffer. 

379 * Return a pointer to the null-terminated data buffer. 

380 */ 

381 static char * 

382 _db_readdat(DB *db) 











383 { 

384 if (lseek(db->datfd, db->datoff, SEEK_SET) == -1) 

385 err_dump("_db_readdat: lseek error"); 

386 if (read(db->datfd, db->datbuf, db->datlen) != db->datlen) 
387 err_dump("_db_readdat: read error"); 


388 if (db->datbuf[db->datlen-1] != NEWLINE) /* sanity check 


*/ 


389 err_dump("_db_readdat: missing newline"); 

390 db->datbuf[db->datlen-1] = 0; /* replace newline with null */ 
391 return(db->datbuf); /* return pointer to data record */ 
392 } 

393 /* 

394 * Delete the specified record. 

395 */ 

396 int 

397 db _delete(DBHANDLE h, const char *key)398 { 

399 DB *db = h; 

400 int rc = 0; /* assume record will be found 


401 if (_db_find_and_lock(db, key, 1) == 0) { 


402 _db_dodelete(db); 

403 db->cnt_delok++; 

404 } else { 

405 rc = -1; /* not found */ 

406 db->cnt_delerr++; 

407 } 

408 if (un_lock(db->idxfd, db->chainoff, SEEK_SET, 1) < 0) 
409 err_dump("db_delete: un_lock error"); 

410 return(rc); 

411} 


[377—392] 在 datoff 和 datlen 已 经 被 正确 初始 化 后 ，_db_readdat 函 数 


将 数据 记录 的 内 容 读 入 DB 结构 中 的 datbuf 字 段 指 疝 的 缓冲 区 。 


[393~411] db_delete 函 数 用 于 删除 与 给 定 键 匹 配 的 一 条 记录 。 使 用 





_db_find_and_lock 来 判断 在 数据 库 中 该 记录 是 否 存 在 。 如 果 存 在 ， 则 调 
用 _db_dodelete 函 数 执行 删除 该 记录 的 操作 。_db_find and lock 的 第 三 
个 参数 控制 对 散 列 链 是 加 读 锁 还 是 写 锁 。 此 处 ， 因 为 可 能 执行 更 改 该 链 
表 的 操作 ， 所 以 要 加 一 把 写 锁 。 db _find_ and_ lock 返回 时 ， 这 把 锁 仍 旧 
存在 ， 为 此 不 管 是 否 找到 了 所 需 的 记录 ， 都 需要 解除 这 把 锁 。 








412 /* 

413 * Delete the current record specified by the DB structure. 
414 * This function is called by db_delete and db_store, after 
415 * the record has been located by _db_find_and_lock.416 */ 
417 static void 


418 _db_dodelete(DB *db)419 { 


420 int 1; 

421 char *ptr; 

422 off_t freeptr, saveptr; 

423 fs 

424 * Set data buffer and key to all blanks. 

425 a 

426 for (ptr = db->datbuf, i = 0; i < db->datlen - 1; i++) 
427 *ptr++ = SPACE; 


428 *ptr = 0; /* null terminate for _db_writedat */ 
429 ptr = db->idxbuf; 
430 while (*ptr) 


431 *ptr++ = SPACE; 

432 ym 

433 * We have to lock the free list. 

434 5 

435 if (writew_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 
436 err_dump("_db_dodelete: writew_lock error"); 

437 i 

438 * Write the data record with all blanks. 

439 a 


440 _db_writedat(db, db->datbuf, db->datoff, SEEK_SET); 

[412~431] _db_dodelete 涵 数 执行 从 数据 库 中 删除 一 条 记录 的 所 有 
操作 。 (该 函数 也 可 以 由 db_store 调 用 。) 此 函数 的 大 部 分 工作 仅仅 是 
更 新 空 闪 链表 以 及 与 键 对 应 的 散 列 链 。 当 一 条 记录 被 删除 后 ， 将 其 键 和 
数据 记录 设 为 空 。 本 章 后 面 将 提 到 的 函数 db_nextrec 要 用 到 这 一 点 。 

[432~440] 调用 writew_lock 对 空 朵 链表 加 写 锁 ， 这 样 能 防止 两 个 
进程 同时 删除 不 同 链表 上 的 记录 时 产生 相互 影响 ， 因 为 要 将 被 删除 的 记 
录 添 加 到 空闲 链表 中 ， 这 将 改变 空闲 链表 指针 ， 而 一 次 只 能 有 一 个 进程 
能 这 样 做 。 

调用 函数 _db_writedat 清 空 数据 记录 。 这 时 _db_writedat 并 不 对 数据 
文件 加 写 锁 ， 这 是 因为 db_delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 
这 保证 不 会 再 有 其 他 进程 能 够 读 、 写 这 条 记录 。 








441 /* 
442 * Read the free list pointer. Its value becomes the 
443 * chain ptr field of the deleted index record. This means 


444 * the deleted record becomes the head of the free list. 


445 */ 


446 freeptr = _db_readptr(db, FREE_OFF); 

447 ka 

448 * Save the contents of index record chain ptr, 

449 * before it's rewritten by _db_writeidx. 

450 eh 

451 saveptr = db->ptrval; 

452 hs 

453 * Rewrite the index record. This also rewrites the length 

454 * of the index record, the data offset, and the data length, 

455 * none of which has changed, but that's OK. 

456 gi 

457 _db_writeidx(db, db->idxbuf, db->idxoff, SEEK_SET, 
freeptr); 

458 /* 

459 * Write the new free list pointer. 

460 gi 

461 _db_writeptr(db, FREE_OFF, db->idxoff); 

462 /* 

463 * Rewrite the chain ptr that pointed to this record being 

464 * deleted. Recall that _db_find_and_lock sets db->ptroff to 

465 * point to this chain ptr. We set this chain ptr to the 

466 * contents of the deleted record's chain ptr, saveptr. 

467 */ 

468 _db_writeptr(db, db->ptroff, saveptr); 

469 if (un_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 

470 err_dump("_db_dodelete: un_lock error"); 

471 } 





[441~461] 读 空 朵 链表 指针 ， 接 着 修改 索引 记录 。 让 这 条 记录 的 下 
一 条 记录 指针 指 回 空 闲 链表 的 第 一 条 记录 《如 果 空 闲 链表 为 空 ， 则 这 个 
新 的 链表 指针 置 为 0) 。 清 除 键 之 后 用 正和 家 删除 索引 记录 的 侦 移 量 更 新 
空间 链表 指针 ， 也 就 是 使 其 指向 当前 删除 的 这 条 记录 。 这 意味 者 空 几 链 
表 的 处 理 基于 后 进 移出 《虽然 是 以 首次 适应 算法 来 删除 空闲 链表 项 ) ， 
也 就 是 说 被 删除 的 记录 部 被 添加 到 空 几 链表 头 部 。 

没有 为 每 个 文件 分 别 设 置 空 亲 链表 。 将 一 个 删除 的 索引 记录 添加 到 
空闲 链表 时 ， 该 索引 记录 仍 指 同 已 删除 的 数据 记录 。 当 然 还 有 更 好 的 处 
理 方法 ， 但 复杂 性 会 增加 。[462 一 471] ”修改 散 列 链 中 前 一 条 记录 的 指 





针 ， 使 其 指 疝 正 删除 记录 之 后 的 记录 ， 这 样 就 从 散 列 链 中 移 除了 要 删除 
的 记录 。 最 后 对 空闲 链表 解锁 。770 

472 /* 

473 * Write a data record. Called by _db_dodelete (to write 

474 * the record with blanks) and db_store.475 */ 

476 static void 

477 _db_writedat(DB *db, const char *data, off_t offset, int whence)478 


{ 
479 struct iovec iov[ 2]; 
480 Static char newline = NEWLINE; 
481 从 
482 * If we're appending, we have to lock before doing the lseek 
483 * and write to make the two an atomic operation. If we're 
484 * overwriting an existing record, we don't have to lock. 
485 ef 
486 if (whence == SEEK_END) /* we're appending, lock entire 
file */ 
487 if (writew_lock(db->datfd, 0, SEEK_SET, 0) < 0) 
488 err_dump("_db_writedat: writew_lock error"); 
489 if ((db->datoff = lseek(db->datfd, offset, whence)) == -1) 
490 err_dump("_db_writedat: lseek error"); 
491 db->datlen = strlen(data) + 1; /* datlen includes newline */ 
492 iov[0].iov_base = (char *) data; 
493 iov[O].iov_len = db->datlen - 1; 
494 iov[1].iov_base = &newline; 
495 iov[1].iov_len = 1; 
496 if (writev(db->datfd, &iov[0], 2) != db->datlen) 
497 err_dump("_db_writedat: writev error of data record"); 
498 if (whence == SEEK_END) 
499 if (un_lock(db->datfd, 0, SEEK_SET, 0) < 0) 
500 err_dump("_db_writedat: un_lock error"); 
501 } 


[472~ 491] 调用 函数 _db_writedat 写 一 个 数据 记录 。 当 删除 一 记录 
时 ， 调 用 函数 _db_writedat 清空 数据 记录 ; 这 时 _db_writedat 并 不 对 数据 
文件 加 写 锁 ， 因 为 db_delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 保证 
不 会 再 有 其 他 进程 能 够 读 、 写 这 条 记录 。 在 本 节 稍 后 处 说 明 db_store 函 
数 时 ， 会 明 到 _db_writedat 函 数 妃 加 写 数 据 文件 的 情况 ， 此 时 就 必需 对 








该 文件 加 锁 。 

定位 到 要 写 数据 记录 的 位 置 。 要 写 的 字 节 数 是 记录 长 度 加 1 个 字 
节 ， 这 1 个 字 节 是 表示 记录 终止 的 换行 符 。 

[492~501] 设置 iovec 数 组 ， 调 用 writev 写 数据 记录 和 换行 符 。 不 能 
想当然 地 认为 调用 者 缓冲 区 的 尾 端 有 空间 可 以 退 加 换行 符 ， 所 以 应 该 将 
换行 人 符 写 入 男 一 个 绥 冲 区 ， 然 后 再 从 该 绥 冲 区 写 至 数据 记录 。 如 果 正 在 
对 文件 妃 加 一 条 记录 ， 那 么 束 释 放 早 先 获 得 的 锁 。 

502 /* 

503 * Write an index record. _db_writedat is called before 

504 * this function to set the datoff and datlen fields in the 

505 * DB structure, which we need to write the index record. 

506 */ 

507 static void 

508 _db_writeidx(DB *db, const char *key, 























509 off_t offset, int whence, off_t ptrval) 

511 struct iovec iov[2]; 

512 char asciiptrlen[PTR_SZ + IDXLEN_SZ + 1]; 
513 int len; 

510 { 

514 if ((db->ptrval = ptrval) < 0 || ptrval > PTR_MAX) 

515 err_quit("_db_writeidx: invalid ptr: %d", ptrval); 

516 sprintf(db->idxbuf, "%s%c%lld%c%ld\n"", key, SEP, 

517 (long long)db->datoff, SEP, (long)db->datlen); 

518 len = strlen(db->idxbuf); 

519 if (len < IDXLEN_MIN || len > IDXLEN_MAX) 

520 err_dump("_db_writeidx: invalid length"); 

521 sprintf(asciiptrlen, "%*lld%*d", PTR_SZ, (long long)ptrval, 
522 IDXLEN_SZ, len); 

523 /* 

524 * If we’re appending, we have to lock before doing the lseek 
525 * and write to make the two an atomic operation. If we’re 
526 * overwriting an existing record, we don’t have to lock. 
527 */ 

528 if (whence == SEEK_END) /* we’re appending */ 
529 if (writew_lock(db->idxfd, ((db- 


>nhash+1)*PTR_SZ)+1, 
530 SEEK_SET, 0) < 0) 


531 err_dump("_db_writeidx: writew_lock error"); 

[502~522] ”调用 _db_writeidx 函 数 写 一 条 索引 记录 。 在 验证 散 列 链 
中 下 一 个 指针 有 效 后 ， 创 建 索 引 记 录 ， 并 将 它 的 后 半 部 分 存放 到 idxbuf 
中 。 需 要 索引 记录 这 一 部 分 的 长 度 以 创建 该 记录 的 前 半 部 分 ， 而 前 半 部 
分 被 存放 到 局 部 变量 asciiptrlen 中 。 

注意 ， 使 用 强制 类 型 转换 使 得 sprintf 语 句 的 参数 的 长 度 与 格式 说 明 
中 相 匹 配 ， 这 样 做 是 因为 off_t 和 size_t 数 据 类 型 的 长 度 因 平台 不 同 而 不 
a ag a 所 以 不 能 假定 off_t 数 据 类 型 的 

[523 一 531] 和 _db_writedat 一 样 ， 只 有 在 追加 新 索引 记录 时 这 一 函 
数 才 需要 加 锁 。 

_db_dodelete 调 用 此 函数 是 为 了 重 写 一 条 已 有 的 索引 记录 。 在 这 种 
情况 下 ， 调 用 者 已 经 在 散 列 链 上 加 了 写 锁 ， 所 以 不 再 需要 加 另外 的 锁 。 

532 ie 


























533 * Position the index file and record the offset. 

534 7 

535 if ((db->idxoff = lseek(db->idxfd, offset, whence)) == -1) 

536 err_dump("_db_writeidx: lseek error"); 

537 iov[0].iov_base = asciiptrlen; 

538 iov[O].iov_len = PTR _SZ+IDXLEN_ SZ; 

539 iov[1].iov_base = db->idxbuf; 

540 iov[1].iov_len = len; 

541 if (writev(db->idxfd, &iov[0], 2) != PTR_SZ + IDXLEN_SZ 
+ len) 

542 err_dump("_db_writeidx: writev error of index record"); 

543 if (whence == SEEK_END) 

544 if (un_lock(db->idxfd, ((db->nhash+1)*PTR_SZ)+1, 

545 SEEK_SET, 0) < 0) 

546 err_dump("_db_writeidx: un_lock error"); 

547 } 

548 /* 


549 * Write a chain ptr field somewhere in the index file: 
550 * the free list, the hash table, or in an index record. 
551 */ 

552 static void 

553 _db_writeptr(DB *db, off_t offset, off_t ptrval)554 { 
555 char asciiptr[ PTR_SZ + 1]; 


556 if (ptrval < 0 || ptrval > PTR_MAX) 

557 err_quit("_db_writeptr: invalid ptr: %d", ptrval); 
558 sprintf(asciiptr, "%*lld", PTR_SZ, (long long)ptrval); 
559 if (lseek(db->idxfd, offset, SEEK_SET) == -1) 


560 err_dump("_db_writeptr: lseek error to ptr field"); 
561 if (write(db->idxfd, asciiptr, PTR_SZ) != PTR_SZ) 
562 err_dump("_db_writeptr: write error of ptr field"); 
563 } 


[532~547] 定位 到 开始 写 索 引 记 录 的 位 置 ， 将 该 偏 移 量 存 入 DB 结 
RIA idxoff 字段 。 因 为 在 两 个 独立 的 缓冲 区 中 构建 索引 记录 ， 所 以 调用 
writev 将 它 存 放 到 索引 文件 中 。 

如 采 是 退 加 写 该 文件 ， 则 释放 在 定位 操作 前 获得 的 锁 。 从 并 发 运行 
进程 退 加 新 记录 到 数据 库 的 角度 思考 问题 ， 那 么 这 把 锁 使 定位 操作 和 写 
操作 成 为 原子 操作 。 

[548~563] _db_writeptr 被 用 于 将 一 散 列 链 指针 写 至 索引 文件 中 。 验 
证 该 指针 在 索引 文件 的 边界 范围 内 ， 然 后 将 它 转换 成 ASCII 字 符 串 。 按 
ce 的 偏 移 量 在 索引 文件 中 定位 ， 然 后 将 该 指针 ASCII 字 符 串 写 入 索引 
文件 。 

564 /* 

565 * Store a record in the database. Return 0 if OK, 1 if record 

566 * exists and DB_INSERT specified, -1 on error. 











567 */ 

568 int 

569 db_store(DBHANDLE h, const char *key, const char *data, int 
flag) 

570 { 

571 DB *db = h; 

572 int rc, keylen, datlen; 

573 off t ptrval; 

574 if (flag != DB_INSERT && flag != DB_REPLACE && 

575 flag != DB_STORE) { 

576 errno = EINVAL; 

577 return(-1); 

578 } 

579 keylen = strlen(key); 

580 datlen = strlen(data) + 1; /* +1 for newline at end */ 


581 if (datlen < DATLEN_MIN |] datlen > DATLEN_MAX) 


582 err_dump("db_store: invalid data length"); 
583 hs 


584 * _db_find_and_lock calculates which hash table this new 
record 

585 * goes into (db->chainoff), regardless of whether it already 

586 * exists or not. The following calls to _db_writeptr change 
the 

587 * hash table entry for this chain to point to the new record. 

588 * The new record is added to the front of the hash chain. 

589 oF 

590 if (_db_find_and_lock(db, key, 1) < 0) { /* record not found 
*/ 

591 if (flag == DB_REPLACE) { 

592 rc = -1; 

593 db->cnt_storerr++; 

594 errno = ENOENT; /* error, record does 
not exist */ 

595 goto doreturn; 

596 } 


[564~582] db_store K HR Aide PIAA. A 
先 验证 参数 flag 的 值 。 然 后 ， 检 查 数据 记录 长 度 是 否 有 效 。 如 果 无 效 ， 
则 删除 core 文 件 并 终止 。 作 为 一 个 例子 这 样 处 理 无 可 厚 非 ， 但 如 果 构 造 
正式 应 用 的 函数 库 ， 那 么 最 好 返回 出 错 状 态 而 非 终 止 ， 这 样 可 以 给 应 用 
程序 一 个 恢复 的 机 会 。 

[583~596] 调用 _db_find_and_lock 以 查看 这 个 记录 是 否 已 经 存在 。 
如 果 记 录 并 不 存在 且 指 定 的 标志 为 DB_INSERT 或 DB_STORE， 或 者 记 
录 存 在 且 指 定 的 标志 为 DB_REPLACE 或 DB_STORE， 那 么 这 些 都 是 允 
许 的 。 蔡 换 一 条 已 有 的 记录 意味 着 键 不 变 ， 而 数据 记录 很 可 能 不 同 。 注 
意 ， 因 为 db_store 很 可 能 会 改变 散 列 链 ， 所 以 调用 _db_find_and_lock 的 
最 后 一 个 参数 指明 要 对 散 列 链 加 写 锁 。 




















597 /* 

598 * db_find_and_lock locked the hash chain for us; read 
599 * the chain ptr to the first index record on hash chain. 
600 */ 

601 ptrval = _db_readptr(db, db->chainoff); 

602 if (_db_findfree(db, keylen, datlen) < 0) { 

603 /* 


604 * Can't find an empty record big enough. 
Append the 

605 * new record to the ends of the index and data 
files. 

606 */ 

607 _db_writedat(db, data, 0, SEEK_END); 

608 _db_writeidx(db, key, 0, SEEK_END, ptrval); 

609 /* 

610 * db->idxoff was set by _db_writeidx. The 
new 

611 * record goes to the front of the hash chain. 

612 Xj: 

613 _db_writeptr(db, db->chainoff, db->idxoff); 

614 db->cnt_stor1++; 

615 } else { 

616 is 

617 * Reuse an empty record. _db_findfree removed 
it from 

618 * the free list and set both db->datoff and db- 
>idxoff. 

619 * Reused record goes to the front of the hash 
chain. 

620 */ 

621 _db_writedat(db, data, db->datoff, SEEK_SET); 

622 _db_writeidx(db, key, db->idxoff, SEEK_SET, 
ptrval); 

623 _db_writeptr(db, db->chainoff, db->idxoff); 

624 db->cnt_stor2++; 

625 


[597~601] oe db _find_and lock 后， 代码 分 成 4 种 情况 。 前 两 种 
情况 中 ， 没 有 找到 足够 大 的 空闲 记录， 所 以 添加 一 条 新 纪录 。 读 散 列 链 


上 第 一 项 的 偏 移 量 

[602 一 614] 第 1 种 情况 : 调用 _db_findfree 在 空闲 链表 中 搜索 一 条 已 
删除 的 记录 ， 它 的 键 长 度 和 数据 长 度 2 如 果 没 
有 找到 对 应 大 小 的 空闲 记录 ， RIAA BOGS ATI 昌 加 到 索引 文件 
和 数据 文件 的 末尾 。 调 用 _db_writedat 写 数据 部 分 ， 调 用 _db_writeidx 写 
索引 部 分 ， 调 用 _db_writeptr 将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。 将 执 





行 此 种 情况 的 计数 器 (cnt_stor1) 值 加 1， 以 便 观察 数据 库 的 运行 状 


Jlo 


[615~625] 


第 2 种 情况 : _db_findfree 找 到 对 应 大 小 的 空 记录 ， 然 后 





将 这 条 空 


记录 从 空 亲 链表 中 移 除 〈 稍 后 就 会 看 到 _db_findfree 的 实现 ) ， 


写 入 新 的 索引 记录 和 数据 记录 ， 然 后 ， 如 同 第 1 种 情况 一 样 ， 将 新 记录 
添加 到 对 应 的 散 列 链 的 头 部 。 将 执行 此 种 情况 的 计数 器 (cnt_stor2) 值 
加 1， 以便 观察 数据 库 的 运行 状况 。 
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} else { /* record found */ 

if (flag == DB_INSERT) { 
rc = 1; /* error, record already in db */ 
db->cnt_storerr++; 
goto doreturn; 

} 

/* 

* We are replacing an existing record. We know the 


* key equals the existing key, but we need to check if 
* the data records are the same size. 
*/ 
if (datlen != db->datlen) { 
_db_dodelete(db); /* delete the existing record */ 
/* 
* Reread the chain ptr in the hash table 
* (it may change with the deletion). 
*/ 
ptrval = _db_readptr(db, db->chainoff); 
/* 
* Append new index and data records to end of 


*/ 
_db_writedat(db, data, 0, SEEK_END); 
_db_writeidx(db, key, 0, SEEK_END, ptrval); 
/* 
* New record goes to the front of the hash chain. 
*/ 
_db_writeptr(db, db->chainoff, db->idxoff); 
db->cnt_stor3++; 


654 } else { 

[626~631] 另 两 种 情况 是 具有 相同 键 的 记录 在 数据 库 中 已 存在 ， 如 
果 不 想 蔡 换 该 记录 ， 则 设置 表示 一 条 记录 已 经 存在 的 返回 码 ， 将 存储 出 
音 计数 的 计数 器 cnt_storerr 值 加 1， 然 后 跳 转 至 函数 末尾 ， 在 此 处 理 公 
HR EE Be 

[632 一 654] 第 3 种 情况 : 要 蔡 换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 
度 与 已 有 记录 的 长 度 不 一 样 。 调 用 _db_dodelete 删 除 已 有 记录 ， 将 该 删 
除 记 录放 在 空闲 链表 头 部 。 然 后 ， 调 用 _db_writedat 和 _db_writeidx 将 新 
记录 追加 到 索引 文件 和 数据 文件 的 末尾 (也 可 以 用 其 他 方法 ， 如 可 以 再 
找 一 找 是 否 有 数据 大 小 正好 的 已 删除 的 记录 项 ) 。 最 后 调用 _db_writeptr 
将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。DB 结 构 中 的 cnt_stor3 计 数 器 记录 























发 生 此 种 情况 的 次 数 。 
655 /* 
656 * Same size data, just replace data record. 
657 */ 
658 _db_writedat(db, data, db->datoff, SEEK_SET); 
659 db->cnt_stor4++; 
660 } 
661 } 
662 rc = 0; /* OK */ 
663 doreturn: /* unlock hash chain locked by _db_find_and_lock */ 
664 if (un_lock(db->idxfd, db->chainoff, SEEK_SET, 1) < 0) 
665 err_dump("db_store: un_lock error"); 
666 return(rc);667 }668 /* 


669 * Try to find a free index record and accompanying data record 
670 * of the correct sizes. We're only called by db_store.671 */ 

672 static int 

673 _db_findfree(DB *db, int keylen, int datlen)674 { 


675 int IC; 

676 off_t offset, nextoffset, saveoffset; 

677 ‘hi 

678 * Lock the free list. 

679 g 

680 if (writew_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 
681 err_dump("_db_findfree: writew_lock error"); 

682 /* 


683 * Read the free list pointer. 


684 */ 

685 saveoffset = FREE_OFFE: 

686 offset = _db_readptr(db, saveoffset); 

[655~661] 第 4 种 情况 : 蔡 换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 度 
与 已 有 记录 的 长 度 恰好 一 样 。 这 是 最 容易 的 情况 ， 只 需要 重 写 数据 记录 
即 可 ， 并 将 这 种 情况 的 计数 器 〈cnt_stor4) 值 加 1。 

[662 一 667] 在 正常 情况 下 ， 设 置 表示 成 功 的 返回 码 ， 然 后 进入 公共 
返回 逻辑 。 对 散 列 链 解锁 〈 这 把 锁 是 由 调用 _db_find_and_lock 而 加 上 
的 ) ， 然 后 返回 调用 者 。 

[668~686] dbfindfree 函 数 试图 找到 一 个 指定 大 小 的 空闲 索引 记录 和 
相关 联 的 数据 记录 。 需 要 对 空闲 链表 加 写 锁 以 避免 与 其 他 使 用 空闲 链表 
a 在 对 空闲 链表 加 写 锁 后 ， 得 到 空闲 链表 的 头 指针 地 























687 while (offset != 0) { 

688 nextoffset = _db_readidx(db, offset); 

689 if (strlen(db->idxbuf) == keylen && db->datlen == 
datlen) 

690 break; /* found a match */ 

691 saveoffset = offset; 

692 offset = nextoffset; 

693 } 

694 if (offset == 0) { 

695 rc = -1; /* no match found */ 

696 } else { 

697 /* 

698 * Found a free record with matching sizes. 

699 * The index record was read in by _db_readidx above, 

700 * which sets db->ptrval. Also, saveoffset points to 

701 * the chain ptr that pointed to this empty record on 

702 * the free list. We set this chain ptr to db->ptrval, 

703 * which removes the empty record from the free list. 

704 */ 

705 _db_writeptr(db, saveoffset, db->ptrval); 

706 rc = 0; 

707 /* 

708 * Notice also that _db_readidx set both db->idxoff 


709 * and db->datoff. This is used by the caller, db_store, 


710 * to write the new index record and data record. 
711 */ 


712 } 

713 is 

714 * Unlock the free list. 

715 of 

716 if (un_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 
717 err_dump("_db_findfree: un_lock error"); 

718 return(rc); 

719 } 


[687 ~693] _db_findfree 中 的 while 循环 遍历 空闲 链表 以 搜寻 一 个 能 
人 够 匹配 键 长 度 和 数据 长 度 的 索引 记录 项 。 在 这 个 简单 的 实现 中 ， 只 有 当 
一 个 已 删除 记录 的 键 长 度 及 数据 长 度 与 要 插入 的 新 记录 的 键 长 度 及 数据 
人 
会 增加 。 

[694 一 712] 如 有 果 找 不 到 所 要 求 键 长 度 和 数据 长 度 的 可 用 记录 ， 则 设 
置 表 示 失 败 的 返回 码 。 人 否则 ， 将 已 找到 记录 的 下 一 个 链 指针 写 至 前 一 记 
录 的 链表 指针 。 这 样 就 从 空闲 链表 中 移 除了 该 记录 。[713 一 719] 一 旦 结 
束 对 空 闪 链表 的 操作 ， 立 即 释 放 写 锁 。 然 后 对 调用 者 返回 状态 人 码 。 

720 /* 

721 * Rewind the index file for db_nextrec.722 * Automatically called 
by db_open.723 * Must be called before first db_nextrec.724 */ 








725 void 
726 db_rewind(DBHANDLE h)727 { 
728 DB *db = h; 


729 off t offset; 
730 offset = (db->nhash + 1) * PTR_SZ; /* +1 for free list ptr */ 


731 /* 

732 * We're just setting the file offset for this process 

733 * to the start of the index records; no need to lock. 

734 * +1 below for newline at end of hash table. 

735 a 

736 if ((db->idxoff = lseek(db->idxfd, offset+1, SEEK_SET)) == 
-1) 

737 err_dump("db_rewind: lseek error");738 }739 /* 

740 * Return the next sequential record. 


741 * We just step our way through the index file, ignoring deleted 


742 * records. db_rewind must be called before this function is 
743 * called the first time. 


744 gi 

745 char * 

746 db_nextrec(DBHANDLE h, char *key)747 { 
748 DB *db = h; 


749 char C; 

750 char *ptr; 

[720~738] db_rewind 函 数 用 于 把 数据 库 重 置 到 “起 始 状 态 ”， 将 索引 
文件 的 文件 偶 移 量 设置 为 指向 第 一 条 索引 记录 〈 紧 跟 在 散 列 表 之 后 ) o 
《回忆 图 20-2 中 索引 文件 的 结构 。) 

[739~750] db_nextrec 函数 返回 数据 库 的 下 一 条 记录 。 返 回 值 是 指 
问 数 据 缓冲 区 的 指针 。 如 果 调 用 者 提供 的 key 参 数 非 空 ， 将 相应 的 键 复 
制 到 该 缓冲 区 中 。 调 用 者 负责 分 配 可 以 存放 键 的 足够 大 的 绥 冲 区 。 大 小 
为 IDXLEN_MAX 字 市 的 缓冲 区 足够 存放 任意 键 。 记 录 按 数据 库 文件 中 
存放 的 顺序 逐一 返回 。 也 就 是 说 ， 记 录 并 不 按键 值 大 小 排序 。 另 外 ， 
db_nextrec 并 不 跟随 散 列 链表 ， 所 以 已 删除 的 记录 也 会 被 读 取 ， 但 是 不 
同调 用 者 返回 这 种 已 删除 记录 。 

















751 /* 

752 * We read lock the free list so that we don't read 

753 * a record in the middle of its being deleted. 

754 */ 

755 if (readw_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 
756 err_dump("db_nextrec: readw_lock error"); 

757 do { 

758 /* 

759 * Read next sequential index record. 

760 */ 

761 让 (db _ readidx(db, 0) < 0) { 

762 ptr = NULL; /* end of index file, EOF */ 
763 goto doreturn; 

764 

765 ee 

766 * Check if key is all blank (empty record). 

767 */ 

768 ptr = db->idxbuf; 


769 while ((c = *ptr++) !=0 && c== SPACE) 


770 ; /* skip until null byte or nonblank */ 


771 } while (c == 0);/* loop until a nonblank key is found */ 
772 if (key != NULL) 

773 strcpy(key, db->idxbuf); /* return key */ 

774 ptr = _db_readdat(db);/* return pointer to data buffer */ 
775 db->cnt_nextrec++; 

776 doreturn: 

777 if (un_lock(db->idxfd, FREE_OFF, SEEK_SET, 1) < 0) 
778 err_dump("db_nextrec: un_lock error"); 

779 return(ptr); 

780 } 





[751~756] 对 空闲 链表 加 读 锁 ， 使 得 正在 读 该 链表 时 ， 其 他 进程 不 
能 从 中 移 除 记录 。 

[757 一 771] 调用 _db_readidx 读 下 一 个 记录 。 传 送 给 该 毅 数 的 偶 移 量 
参数 值 为 0， 以 此 通知 该 函数 从 当前 偶 移 量 继续 读 索 引 记录 。 因 为 正在 
逐条 顺序 读 索 引文 件 ， 所 以 会 读 到 已 删除 的 记录 。 仅 需 返 回 有 效 记录 ， 
(回忆 _db_dodelete 函 数 以 设置 全 空格 方式 
清除 键 ) 。 

[772 一 780] 当 找 到 一 有 效 键 时 ， 如 采 调 用 者 已 提供 绥 冲 区 ， 则 将 该 
键 复制 到 该 缓冲 区 。 然 后 读数 据 记 录 ， 并 将 返回 值 设置 为 指向 包含 数据 
记录 的 内 部 缓冲 区 的 指针 值 。 将 统计 计数 右 值 加 1， 对 空 用 链表 解锁 ， 
最 后 返回 指 疝 数据 记录 的 指针 。 

通常 在 下 列 形式 的 循环 中 使 用 db_rewind 和 db_nextrec 这 两 个 函数 : 

db_rewind(db); 

while ((ptr = db_nextrec(db, key)) != NULL) { 

/* process record */ 


} 
前 面 曾 警告 过 ， 记 录 的 返回 没有 一 定 的 顺序 ， 它 们 并 不 按键 的 顺序 


返回 。 
如 果 db_nextrec 函 数 在 循环 中 被 调用 时 数据 库 正 在 被 修改 ， 则 

db_nextrec 返 回 的 记录 只 是 变化 中 的 数据 库 在 某 一 时 间 点 的 快照 

(snapshot) 。db_nextrec 被 调用 时 总 是 返回 一 条 “正确 ”的 记录 ， 也 就 是 
说 它 不 会 返回 一 条 已 删除 的 记录 。 但 有 可 能 一 条 记录 刚 被 db_nextrec 返 
回 后 就 被 删除 。 类 似 地 ， 如 果 db_nextrec 刚 跳 过 一 条 已 删除 的 记录 ， 这 
条 记录 的 空间 束 被 一 条 新 记录 重用 ， 除 非 用 db_rewind 重 新 遇 历 一 通 ， 
否则 在 结果 中 看 不 到 这 条 新 的 记录 。 如 果 通 过 db_nextrec 获 得 一 份 数 据 
库 的 准确 的 “冻结 ”的 快照 很 重要 ， 则 在 这 段 时 间 内 应 该 不 做 插入 和 删除 




















ERIE « 

下 面 来 看 db_nextrec 使 用 的 加 锁 。 因 为 并 不 使 用 任何 散 列 链表 ， 也 
不 能 判断 每 条 记录 属于 哪 条 散 列 链 。 所 以 有 可 能 当 db_nextrec 读 取 一 条 
记录 时 ， 其 索引 记录 正在 被 删除 。 为 了 防止 这 种 情况 ，db_nextrec 对 空 
闲 链表 加 读 锁 ， 这 样 就 可 避免 与 _db_dodelete 和 _db_findfree 相 互 影响 。 

在 结束 对 db.c 源 文 件 的 说 明之 前 ， 对 同文 件 末 尾 追 加 索引 记录 或 数 
据 记 录 时 的 加 锁 再 做 一 些 说 明 。 在 第 1 种 和 第 3 种 情况 中 ，db_store 调 用 
_db_writeidx#ll_ db_writedat 时 ， 第 3 个 参数 为 0， 第 4 个 参数 为 
SEEK_END。 这 里 ， 第 4 个 参数 作为 一 个 标志 用 来 告诉 这 两 个 函数 ， 新 
的 记录 将 被 追加 到 文件 的 末尾 。_db_writeidx 用 到 的 技术 是 对 索引 文件 
加 写 锁 ， 加 锁 的 范围 从 散 列 链 的 末尾 到 文件 的 末尾 。 这 不 会 影响 其 他 数 
据 库 的 读 进 程 和 写 进 程 〈 这 些 进程 将 对 散 列 链 加 锁 )》， 但 如 果 其 他 进程 
此 时 调用 db _store 来 追加 数据 则 会 被 锁 住 。_db_writedat 使 用 的 方法 是 
对 整个 数据 文件 加 写 锁 。 同 样 这 也 不 会 影响 其 他 数据 库 的 读 进 程 和 写 进 
程 〈 它 们 甚至 不 对 数据 文件 加 锁 ) ， 但 如 果 其 他 用 户 此 时 调用 db_store 
来 问 数 据 文 件 奶 加 数据 则 会 被 锁 住 〈 见 习题 20.3) 。 























20.9 性 能 


为 了 测试 这 一 数据 库 函 数 库 ， 也 为 了 获得 一 些 与 典型 应 用 的 数据 访 
问 模式 有 关 的 时 间 测 量 数据 ， 编 写 了 一 个 测试 程序 。 访 程序 接受 两 个 命 
令 行 参数 : 要 创建 的 子 进程 的 个 数 和 每 个 子 进程 同 数据 库 写 的 数据 记录 
的 条 数 Crec) 。 然 后 (通过 调用 db_open) 创建 一 个 空 的 数据 库 ， 通 过 
sr le 目的 子 进程 ， 等 待 所 有 子 进程 结束 。 每 个 子 进程 执行 以 
下 步骤 。 

(1) 加 数据 库 写 nrec 条 记录 。 

(2) 通过 键 值 读 回 nrec 条 记录 。 

(3) 执行 下 面 的 循环 nrecx5 次 。 

(a) 随机 读 一 条 记录 。 

Cb) 每 循环 37 次 ， 随 机 删除 一 条 记录 。 

Cc) 每 循环 11 次 ， 随 机 插入 一 条 记录 并 读 取 这 条 记录 。 

Cd) 每 循环 17 次 ， 随 机 蔡 换 一 条 记录 为 新 记录 。 在 连续 两 次 蔡 换 
中 ， 一 次 用 同样 大 小 的 记录 蔡 换 ， 一 次 用 比 以 前 更 长 的 记录 蔡 换 。 

(4) 将 此 子 进程 写 的 所 有 记录 删除 。 每 删除 一 条 记录 ， 随 机 地 得 
找 10 条 记录 。 

DB 结构 的 cnt_xxx 变 量 记 录 对 数据 库 进 行 的 操作 数 ， 这 些 变量 的 值 
在 函数 中 增加 。 每 个 子 进 程 的 操作 数 一 般 都 会 与 其 他 子 进 程 不 一 样 ， 
为 每 个 子 进程 用 来 选择 记录 的 随机 数 生成 器 是 根据 其 进程 ID 来 初始 化 
的 。 每 个 子 进程 操作 的 典型 计数 值 见 图 20-6。 

读 取 的 次 数 大 约 是 存储 和 删除 的 10 倍 ， 这 可 能 是 许多 数据 库 应 用 程 
序 的 典型 情况 。 

每 一 个 子 进程 只 对 该 子 进程 所 写 的 记录 执行 这 些 操作 〈( 读 取 、 存 储 
和 删除 〉。 由 于 所 有 的 子 进程 对 同一 个 数据 库 进 行 操作 (虽然 对 不 同 的 
记录 ) ， 所 以 会 使 用 并 发 控制 。 数 据 库 中 的 记录 总 数 与 子 进 程 数 成 比 
例 。( 当 只 有 一 个 子 进程 时 ， 一 开始 有 nrec 条 记录 写 入 数据 库 ， 当 有 两 
个 子 进 程 时 ， 一 开始 有 nrec x2 条 记录 写 入 数据 库 ， 依 此 类 推 。) 

通过 运行 测试 程序 的 3 个 不 同 版 本 来 比较 加 粗 粒 度 锁 和 加 细 粒 上 度 锁 
提供 的 并 发 ， 并 且 比 较 3 种 不 同 的 加 锁 方 式 ( 不 加 锁 、 建 议 性 锁 和 强制 
性 锁 ) 。 第 一 个 版 本 使 用 20.8 节 中 的 源 代码 ， 称 为 细 粒 上 度 锁 版 本 。 第 
二 个 版 本 通过 改变 加 锁 调 用 而 使 用 粗 粒 度 锁 ，20.6 节 对 此 已 介绍 过 。 第 
三 个 版 本 将 所 有 加 锁 例 程 均 去 掉 ， 这 样 可 以 计算 出 加 锁 的 开销 。 通 过 改 




















变数 据 库 文件 的 权限 标志 位 ， 还 可 以 使 第 一 个 版 本 和 第 二 个 版 本 加 细 
粒度 锁 和 加 粗 粒 度 锁 ) 使 用 建议 性 锁 或 强制 性 锁 〈 本 节 所 有 的 测试 中 ， 
仅 对 加 细 粒 度 锁 的 实现 测量 了 采用 强制 性 锁 的 时 间 ) 。 


WF font] (每 个 操作 ) | 。 操作 计数 
(nrec=2000) 


db Store、DB_INSRRT， 无 空白 记录 ， 追 加 
db store、DB_INSERT， 重 用 空白 记录 

db store, DB REPLACE， 数 据 长 度 不 同 ， 追 加 
db store, DB _ REPLACE， 数 据 长 度 相同 
db_store， 没 有 找到 记录 

db fetch, 找到 记录 

db_fetch， 没 有 找到 记录 

db delete, 找到 记录 

db_delete， 没 有 找到 记录 
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图 20-6 每 个 子 进程 操作 的 典型 计数 值 

本 节 所 有 的 测试 都 是 在 一 台 运 行 Linux 3.2.0 的 Intel Core-i5 系 统 上 运 
行 的 。 这 个 系统 拥有 4 个 内 核 ， 因 此 可 以 允许 至 多 4 个 进程 并 发 运行 。 

1. 单 进程 的 结果 

图 20-7 显 示 了 只 有 一 个 子 进程 运行 的 结果 ，nrec 分 别 为 2 000. 6 000 
和 12 000。 
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0.10 | 0.22 | 033 1 0.17 033 | 051 | 
0.59 | 132 | 191 i] 088 | 2.13 
12000 || 4.37 | 9.58 | 13.97 || 5.38 | 12.60 | 1801 


图 20-7 单子 进程 、 不 同 的 nrec 和 不 同 的 加 锁 方 法 

最 后 12 列 显示 的 是 以 秒 为 单位 的 时 间 。 在 所 有 的 情况 下 ， 用 户 CPU 
时 间 加 上 系统 CPU 时 间 都 基本 上 等 于 时 钟 时 间 。 这 一 组 测试 受 CPU 限制 
而 不 是 受 磁 盘 操作 限制 。 

中 间 6 列 〈 建 议 性 锁 ) 对 加 粗 粒 度 锁 和 加 细 粒 度 锁 的 结果 基本 一 
样 。 这 是 可 以 理解 的 ， 因 为 对 于 单个 进程 来 说 加 粗 粒 度 锁 和 加 细 粒 度 锁 
并 没有 区 别 ， 除 了 额外 的 fentl 调 用 。 

比较 不 加 锁 和 加 建议 性 锁 ， 可 以 看 到 加 锁 调 用 在 系统 CPU 时 间 上 增 
加 了 32% 一 73%。 即 使 这 些 锁 实际 上 并 没有 使 用 过 (因为 只 有 一 个 进程 
运行 ) ，fcntl 系统 调用 仍 会 有 一 些 时 间 的 开销 。 用 户 CPU 时 间 对 4 种 不 
同 的 加 锁 方法 基本 上 一 样 ， 这 是 因为 用 户 代码 基本 上 是 一 样 的 (除了 调 
用 fcnt 的 次 数 有 些 不 同 ) 。 

关于 图 20-7 要 注意 的 最 后 一 点 是 强制 性 锁 比 建议 性 锁 增 加 了 139% 一 
19% 的 系统 CPU 时 间 。 由 于 对 加 强制 性 细 粒 度 锁 和 加 建议 性 细 粒 度 锁 的 
调用 次 数 是 一 样 的 ， 所 以 增加 的 系统 开销 来 自 读 和 写 。 

最 后 的 测试 是 有 多 个 子 进程 的 不 加 锁 的 程序 。 与 预期 的 一 样 ， 结 果 
是 随机 的 错误 。 一 般 错 误 情 况 包括 : 添加 到 数据 库 中 的 记录 找 不 到 、 测 
试 程 序 异 常 退出 等 。 几 乎 每 次 运行 测试 程序 ， 都 有 不 同 的 错误 发 生 。 这 
是 典型 的 竞争 条 件 一 多 个 进程 在 没有 任何 加 锁 的 情况 下 修改 同一 个 文 
件 ， 错 误 情 况 不 可 预测 。 

2. 多 进程 的 结果 

下 一 组 测试 主要 目的 是 比较 粗 粒度 锁 和 细 粒 上 度 锁 的 不 同 。 前 面 说 
过 ， 由 于 加 细 粒 度 锁 时 数据 库 的 各 个 部 分 被 锁 住 的 时 间 比 加 粗 粒度 锁 
少 ， 所 以 从 直觉 上 说 ， 加 细 粒 度 锁 应 该 能 提供 更 好 的 并 发 性 。 图 20-8 显 
示 了 nrec 取 2 000， 子 进程 数 从 1 一 16 的 测试 FR o 
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图 20-8 nrec=2000 时 不 同 加 锁 方 法 的 比较 

所 有 的 用 户 时 间 、 系 统 时 间 和 时 钟 时 间 的 单位 均 为 秒 。 所 有 这 些 时 
间 均 是 父 进 程 与 所 有 子 进程 的 总 和 。 关 于 这 些 数据 有 许多 需要 考虑 。 

首先 要 注意 的 是 ， 当 使 用 多 进程 时 ， 用 户 时 间 和 系统 时 间 之 和 超过 
了 时 钟 时 间 。 乍 看 起 来 这 有 点 奇怪 ， 不 过 当 玉 用 多 核 时 是 正常 的 。 此 
时 ， 所 有 并 发 的 进程 在 运行 时 其 时 间 会 累积 起 来 ， 所 显示 的 CPU 处 理 时 
间 是 程序 运行 的 所 有 核 运 转 的 时 间 之 和 。 因 为 可 以 并 发 多 个 进程 (每 个 
核 运行 一 个 进程 ) ， 所 以 CPU 处 理 时 间 会 超过 时 钟 时 间 。 





第 8 列 (标记 为 “A 时 钟 *») ， 是 加 建议 性 粗 粒度 锁 与 加 建议 性 细 粒 
度 锁 的 运行 时 钟 时 间 的 百分比 差 。 从 中 可 以 看 到 使 用 细 粒 度 锁 得 到 了 多 
大 的 并 发 性 。 在 运行 测试 的 系统 上 ， 对 于 单一 进程 加 粗 粒度 锁 与 加 细 粒 
e A a 

(230%) 。 

我 们 希望 从 粗 粒度 锁 到 细 粒 度 锁 时 钟 时 间 会 减少 ， 当 启用 多 进程 后 
结果 也 确实 如 此 。 然 而 ， 我 们 预期 当 对 任意 数量 的 进程 使 用 细 粒 度 锁 时 
系统 时 间 仍 然 会 保持 较 高 值 ， 因 为 使 用 细 粒 度 锁 会 发 出 更 多 的 fcntl 调 
用 。 如 果 将 图 20-6 中 的 fcnt 调 用 次 数 加 在 一 起 ， 会 发 现 对 于 粗 粒 度 锁 其 
平均 值 为 87 858， 对 于 细 粒 度 锁 其 平均 值 为 115 520。 基 于 此 ， 我 们 认为 
由 于 增加 了 31% 的 fcntl 调 用 ， 所 以 会 增加 细 粒 上 度 锁 的 系统 时 间 。 然 而 ， 
在 测试 中 加 细 粒 度 锁 的 两 个 进程 其 系统 时 间 减 少 了 ， 超 过 两 个 进程 的 系 
统 时 间 只 有 小 幅 增 加 ， 这 让 人 困惑 。 

出 现 这 种 情况 有 两 个 原因 。 首 先 ， 图 20-7 显示 ， 当 没有 对 锁 进 行 
竞争 时 ， 粗 粒度 锁 和 细 粒 度 锁 的 时 间 之 间 没 有 显著 的 差别 。 这 说 明 对 于 
额外 的 fcnt 调 用 所 引起 的 CPU 负载 并 没有 影响 测试 程序 的 性 能 。 其 次 ， 
使 用 粗 粒 度 锁 时 ， 持 有 锁 的 时 间 较 长 ， 这 也 就 增加 了 其 他 进程 因 等 待 该 
锁 而 陷入 阻塞 的 可 能 性 ， 而 使 用 细 粒 度 锁 时 ， 加 锁 的 时 间 较 短 ， 进 程 被 
阻塞 的 可 能 性 就 降低 了 。 如 果 计 算 fon 的 阻塞 次 数 ， 会 发 现在 使 用 粗 
粒度 锁 时 ， 进 程 阻塞 频率 更 高 。 例 如 ， 当 有 4 个 进程 时 ， 使 用 粗 粒 度 锁 
的 阻塞 次 数 几乎 是 使 用 细 粒 度 锁 的 阻塞 次 数 的 5 倍 。 正 是 这 些 粗 粒 度 锁 
需要 休眠 和 唤醒 进程 的 额外 时 间 增 加 了 系统 时 间 ， 最 终 降 低 了 两 种 锁 的 
系统 时 间 差 异 。 

最 后 一 列 〈 标 记 为 “人 系统 ”) ， 是 从 加 建议 性 细 粒 度 锁 到 加 强制 性 
细 粒 度 锁 的 系统 CPU 时 间 百 分 比 的 增 量 。 从 这 些 值 可 以 看 到 ， 随 着 并 发 
数 的 增加 ， 强 制 性 锁 显 著 增 加 了 系统 时 间 (20% ~76%) 。 

由 于 所 有 这 些 测试 的 用 户 代码 几乎 一 样 〈 对 加 建议 性 细 粒 度 锁 和 强 
制 性 细 粒 度 锁 增 加 了 一 些 fcnt 调 用 ) ， 因 此 预期 对 每 一 行 的 用 户 CPU 时 
间 应 基本 一 样 。 

当 我 们 第 一 次 运行 这 些 测试 时 ， 测 试 显 示 对 于 多 进程 完成 锁 的 使 
用 ， 其 粗 粒 度 锁 的 用 户 时 间 几 乎 是 细 粒 度 锁 的 两 倍 。 因 为 两 个 数据 库 版 
本 是 相同 的 ， 除 了 调用 fcntl 的 次 数 不 同 ， 因 此 这 说 不 通 。 在 调查 研究 
之 后 ， 我 们 发 现 使 用 粗 粒度 锁 时 会 有 更 多 的 竞争 ， 进 程 也 就 会 等 等 更 
久 ， 操 作 系 统 于 是 就 决定 降低 CPU 时 钟 频率 来 节约 电量 。 在 使 用 细 粒 度 
锁 时 ， 会 有 更 多 的 活动 ， 于 是 系统 提高 了 CPU 时 钟 频 率 。 这 使 得 使 用 
粗 粒 度 锁 比 使 用 细 粒 度 锁 运行 得 慢 。 在 禁用 系统 频率 调整 特性 后 ， 我 们 
的 测试 结果 就 没有 这 些 偏差 了 ， 用 户 时 间 的 差别 也 就 小 多 了 。 



































| 人 000 的 那 一 行 很 相似 。 这 与 预 
期 一 致 。 

图 20-9 是 图 20-8 中 加 建议 性 细 粒 度 锁 的 数据 图 。 我 们 绘制 了 进程 数 
从 1 一 16 的 时 钟 时 间 ， 也 绘制 了 用 户 CPU 时 间 除 以 进程 数 后 的 每 进程 用 
户 CPU 时 间 ， 另 外 还 绘制 了 每 进程 系统 CPU 时 间 。 

注意 ， 这 两 个 每 进程 CPU 时 间 都 是 线性 的 ， 但 时 钟 时 间 是 非 线性 
的 。 可 能 的 原因 是 : 当 进 程 数 增 大 时 ， 操 作 系 统 用 于 进程 切换 的 CPU 时 
ee 操作 系统 的 开销 会 增加 时 钟 时 间 ， 但 不 会 影响 单个 进程 的 CPU 
时 间 。 

用 户 CPU 时 间 随 进程 数 增加 的 原因 可 能 是 因为 数据 库 中 有 了 更 多 
的 记录 。 每 一 条 散 列 链 更 长 ， 所 以 _db_find_and lock 函数 平均 要 运行 更 
长 时 间 来 找到 一 条 记录 。 
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图 20-9 图 20-8 中 使 用 建议 性 细 粒 度 锁 的 数据 


每 进程 系统 CPU 时 间 ， 
每 进程 用 户 CPU 时 间 
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20.10 小 结 


本 章 详细 介绍 了 一 个 数据 库 函 数 库 的 设计 与 实现 。 考 虑 到 篇 幅 ， 这 
o 但 也 包括 了 多 进程 并 发 访问 需要 的 对 记录 加 
WAY DBE o 

此 外 ， 还 使 用 不 同 数量 的 进程 以 及 不 同 的 加 锁 方 法 : 不 加 锁 、 建 议 
性 锁 〈 细 粒度 锁 和 粗 粒 度 锁 ) 和 强制 性 锁 ， 研 究 了 这 个 函数 库 的 性 能 。 
可 以 看 到 加 建议 性 锁 比 不 加 锁 在 时 钟 时 间 上 增加 了 299% 一 59%， 加 强制 
性 锁 比 加 建议 性 锁 耗 时 再 增加 约 159%。 





习题 


20.1 在 _db_dodelete 中 使 用 的 加 锁 是 比较 保守 的 。 例 如 ， 如 果 等 到 
真正 要 用 空闲 链表 时 再 加 锁 ， 则 可 获得 更 大 的 并 发 性 。 如 果 将 调用 
writew_lock 移 到 调用 _db_writedat 和 _db_readptr 之 间 会 发 生 什 么 呢 ? 

20.2 如 果 db_nextrec 不 对 空闲 链表 加 读 锁 而 被 读 的 记录 正在 被 删 
除 ， 描 述 在 怎样 的 情况 下 ， db_nextrec 会 返回 正确 的 键 但 是 空 的 (不 正 
WAN) 数据 记录 。 (Chia: 查看 _db_dodelete。) 

20.3 ”20.8 节 的 结尾 部 分 描述 了 _db_writeidx 和 _db_writedat 的 加 锁 。 
我 们 说 过 这 种 加 锁 不 会 干涉 除了 调用 db_store 之 外 的 其 他 的 读 进 程 和 写 
进程 。 如 果 改 为 强制 性 锁 ， 这 还 成 立 吗 ? 

20.4 怎样 把 fsync 集 成 到 这 个 数据 库 函 数 库 中 ? 

20.5 在 db_store 中 ， 先 写 数据 记录 ， 然 后 再 写 索 引 记 录 。 如 果 将 顺 
序 颠 倒 ， 会 发 生 什 么 ? 

20.6 建立 一 个 新 的 数据 库 并 写 入 一 些 记 录 。 写 一 个 程序 调用 
db_nextrec 来 读数 据 库 中 的 每 条 记录 ， 并 调用 _db_hash 来 计算 每 条 记录 
的 散 列 值 。 根 据 每 条 散 列 链 上 的 记录 数 画 出 直方 图 。_db_hash 中 的 散 列 
函数 是 否 能 满足 需求 ? 

20.7 修改 数据 库 函 数 ， 使 得 索引 文件 中 散 列 链 的 数目 可 以 在 数据 库 
建立 时 指定 。 

20.8 ”比较 两 种 情况 下 数据 库 函 数 的 性 能 : Ca) 数据 库 与 测试 程序 
在 同一 台 机 器 上 ; (Cb) 数据 库 与 测试 程序 在 不 同 的 机 器 上 ， 经 由 NEFS 
进行 访问 。 这 个 数据 库 函 数 库 提 供 的 记录 锁 机 制 还 能 工作 吗 ? 

20.9 只 有 当 键 缓冲 区 和 数据 缓冲 区 与 其 所 需 的 大 小 精确 匹配 时 ， 数 
据 库 才 会 返回 空闲 链表 记录 。 请 修改 数据 库 以 使 空闲 链表 可 以 使 用 于 较 
应 该 如 何 更 改 数据 库 的 永久 格式 来 支持 这 种 特 
性 呢 ? 

20.10 ”在 实现 了 习题 20.9 的 方案 后 ， 编 写 一 个 工具 以 使 数据 库 格式 
可 以 从 一 种 转换 为 男 一 种 。 





























21.1 SIS 


现在 我 们 开发 一 个 能 够 与 网 络 打印 机 通信 的 程序 。 这 些 打印 机 通过 
以 太 网 与 多 个 计算 机 互联 ， 并 且 通 常 既 文 持 纯 文 本 文件 也 文 持 PostScript 
文件 。 尽 管 一 些 应 用 程序 也 文 持 其 他 通信 协议 ， 但 一 般 使 用 网 络 打印 协 
i CInternet Printing Protocol, IPP) 与 打印 机 通信 。 

我 们 将 描述 两 个 程序 : 打印 假 脱 机 守护 进程 〈print spooler 
daemon) 将 作业 发 送 到 打印 机 ; 命令 行程 序 将 打印 作业 提交 到 假 胶 机 守 
护 进程 。 因 为 假 脱 机 守护 进程 必须 处 理 很 多 操作 (与 客户 端 通信 来 提交 
作业 、 与 打印 机 通信 、 读 文件 、 扫 描 目录 等 ) ， 这 就 提供 了 一 个 机 会 来 
使 用 前 面 章节 所 提 到 的 函数 。 例 如 ， 使 用 线程 (第 11 章 和 第 12 章 〉 来 简 
化 假 脱 机 守护 进程 的 设计 ， 使 用 套 接 字 〈 第 16 章 ) 在 调度 文件 打印 的 程 
序 和 打印 假 脱 机 守护 进程 之 间 通 信 ， 也 可 以 在 打印 假 脱 机 守护 进程 与 网 
络 打印 机 之 间 通 信 。 





21.2 网 络 打 印 协议 


网 络 打印 协 议 〈IPP) 为 建立 基于 网 络 的 打印 系统 指定 了 通信 规 
则 。 通 过 将 一 个 IPP 服 务 器 骨 入 到 禹 网 卡 的 打印 机 中 ， 打 印 机 就 能 够 对 
许多 计算 机 系统 的 请 求 加 以 服务 。 这 些 计算 机 系统 实际 上 并 不 需要 在 同 
一 个 物理 网 络 中 。 因 为 IPP 是 建立 在 标准 的 因特网 协议 上 的 ， 所 以 任何 
I 
\ ° 

IPP 由 一 系列 IETF 标准 文档 (Requests For Comment, RFC) 说 
明 ， 这 些 文档 可 以 在 http://www.ietf. org/rfc.html 上 获得 。IEEE 相关 的 打 
印 机 工作 组 (Printer Working Group) 制定 的 标准 草案 也 可 以 在 
http://www.pwg.org/ipp 上 获得 。 图 21-1 列 出 了 IPP 的 主要 文档 ， 还 有 许多 
其 他 文档 进一步 说 明了 过 程 管理 、 作 业 属 性 等 信息 。 


RFC 2567 IPP 设计 有 目标 
RFC 2568 IPP 模型 与 协议 架构 的 基本 原理 


RFC 2911 IPP/1.1， 模 型 与 语义 
RFC 2910 [PP/1.1， 编码 与 传输 
RFC 3196 IPP/1.1: 实现 者 指南 


候选 标准 5100.12-2011 IPP 2.0, 第 2 版 


图 21-1 基本 的 IPP 文 档 

候选 标准 5100.12-2100 指 明 实现 提供 的 所 有 功能 部 要 能 够 支持 符合 
不 同 的 IPP 标 准 版 本 。 有 许多 建议 性 的 IPP 协 议 扩 展 ( 具 体 的 功能 在 IPP 
相关 文档 中 定义 ) 。 将 这 些 功能 分 组 创建 出 不 同 的 一 致 性 分 级 ;每 一 级 
是 一 个 不 同 的 协议 版 本 。 对 于 兼容 性 ， 每 个 更 高 的 一 致 性 级 别 要 符合 低 
版 本 定义 的 大 多 数 要 求 。 本 章 的 示例 中 使 用 的 是 IPP 1.1 版 本 。 

IPP 建 立 在 超 文本 传输 协议 (Hypertext Transfer Protocol, HTTP) 
之 上 (21.347) 。HTTP 叉 建立 在 TCP/IP 之 上 。IPP 报 文 的 结构 如 图 21-2 





所 示 。 


HTTP 


首部 要 打印 的 数据 

















图 21-2 IPP 报 文 结构 

IPP 是 请 求 响应 协议 。 客 户 端 发 送 请 求 到 服务 器 ， 服 务 器 用 响应 报 
文 回 答 这 个 请 求 。IPP 首 部 包含 一 个 域 来 指示 所 需 操作 ， 这 些 操作 可 以 
定义 成 提交 打印 作业 、 取 消 打 印 作 业 、 获 取 作 业 属 性 、 获 取 打 印 机 属 
性 、 暂 停 和 重启 打印 机 、 挂 起 一 个 作业 和 释放 一 个 挂 起 的 作业 。 

图 21-3 显 示 了 一 个 IPP 首 部 的 结构 。 前 两 个 字 节 表示 IPP 版 本 号 ， 对 
于 1.1 版 本 协议 ， 每 个 字 节 的 值 是 1。 对 于 一 个 请 求 协议 ， 接 下 来 两 个 字 
节 包 含 一 个 值 来 指示 请 求 操作 的 类 型 。 对 于 一 个 响应 协议 ， 这 两 个 字 节 
包含 一 个 状态 码 。 








(2 字 节 ) 
(2 字 节 ) 
(4 字 节 ) 
(0-n Z+) 
属性 结束 标志 (1 字 节 ) 








图 21-3 IPP 首 部 结构 
接 下 来 4 字 节 包含 一 个 整数 以 标识 请 求 ， 使 得 请 求 和 响应 相 匹 配 。 
接着 是 可 选 的 属性 ， 然 后 用 属性 结束 标志 终止 。 紧 接着 属性 结束 标志 之 
后 是 任何 与 请 求 相 关联 的 数据 。 
在 首部 ， 整 数 以 有 符号 二 进 制 补 码 以 及 大 问 字 节 序 〈 即 网 络 字 闻 
FR) 方式 存储 。 属 性 按照 组 来 存储 。 每 个 组 都 以 标识 该 组 的 一 个 字 节 开 
始 。 在 每 一 个 组 中 ， 属 性 通常 表示 为 : 1 字 节 的 标志 ， 然 后 是 2 字 市 属性 




















名 长 度 ， 接 着 是 属性 名 ， 然 后 是 2 字 节 属性 值 长 度 ， 最 后 是 属性 值 本 
身 。 属 性 值 可 以 编码 成 字符 串 、 二 进 制 整数 或 者 更 为 复杂 的 结构 ， 如 日 
期 /时 间 恰 。 

图 21-4 显 示 了 attributes-charset 属 性 是 如 何 编码 成 utf-8 类 型 的 值 的 。 


属性 标志 = 0x47 (1 字 节 ) 
(2 字 节 ) 


(18 字 节 ) 


(2 字 节 ) 


属性 值 = utf-8 (5 字 节 ) 





图 21-4 IPP 属 性 编码 样 例 
根据 所 请 求 的 操作 ， 一 些 属 性 需要 在 请 求 报 文 中 提供 ， 而 另 一 些 是 
可 选 的 。 例 如 ， 图 12-5 显 示 了 用 于 为 打印 作业 请 求 定 义 的 属性 。 


attributes-charset 必需 | text A name 类 型 属性 所 使 用 的 字符 集 
attributes-natural-language | 必需 text 或 name 类 型 属性 所 使 用 的 卓然 语言 
printer-uri 必需 | 打印 机 的 统一 资源 标识 符 

requesting-user-name | 提交 作业 的 用 户 名 《如 果 可 以 ， 可 用 于 认证 ) 
job-name 选 | 用 于 区 别 多 个 作业 的 作业 名 
ipp-attribute-fidelity MURA, HUETE RE ACRES EM; A 


则 ， 打 印 机 尽 可 能 打印 作业 

document-name 选 | 文档 名 (如 适合 打印 一 个 旗 标 ) 

document-format XERA CIAA, PostScript) 

document-natural-language } 文档 的 日 然 语言 

compression 压缩 文档 的 算法 

job-k-octets 以 1 024 字 节 单位 计算 的 文档 大 小 

job-impressions 选 | 作业 中 提交 的 图 (内 入 在 页 面 中 的 罗 像 ) 的 数量 

job-media-sheets 作业 打印 张 数 

图 21-5 打印 作业 请 求 的 属性 
IPP 首 部 包含 了 文本 和 二 进 制 混合 数据 。 属 性 名 存储 为 文本 ， 

据 大 小 存储 为 二 进 制 整数 。 这 使 得 构建 和 分 析 首 部 的 过 程 变 得 复杂 ， 
AERE EHET 节 序 、 主 机 处 理 器 是 否 在 任意 ahaa 


之 类 的 问题 。 一 个 较 好 的 可 选 方案 是 将 首部 设计 成 仅 包含 文本 。 这 样 以 
稍微 膨胀 一 些 协 议 报 文 为 代价 简化 处 理 过 程 。 


























21.3 超 文 本 传输 协议 HTTP 


HTTP V1.1 由 RFC 2616 说 明 。HTTP 也 是 请 求 响应 协议 。 请 求 报 文 
包含 的 一 个 开始 行 ， 跟 着 是 首部 行 ， 接 着 是 空白 行 ， 然 后 是 一 个 可 选 的 
实体 主体 。 在 我 们 这 种 情况 ， 实 体 主体 包含 IPP 首 部 和 数据 。 

HTTP 首 部 是 ASCII 码 ， 每 行 以 回 车 Ar) 和 换行 符 (\n) 结束 。 开 
台 行 包含 一 个 method 来 指示 客户 端 请 求 的 操作 、 一 个 统一 资源 定位 符 
(Uniform Resource Locator, URL) 来 描述 服务 器 和 协议 、 一 个 字符 串 
来 表示 HTTP 版 本 。IPP 所 用 的 方法 仅 为 POST， 用 于 将 数据 发 送 到 服务 
at 


首部 行 指定 属性 ， 如 实体 主体 的 格式 和 长 度 。 一 个 首部 行 包 含 一 个 
属性 名 ， 后 紧 随 一 个 冒号 ， 接 着 是 可 选 的 空格 符 ， 然 后 是 属性 值 ， 最 后 
以 回 车 和 换行 符 结 束 。 例 如 ， 为 了 指定 实体 主体 包含 IPP 报 文 ， 应 包含 
如 下 的 首部 行 : 

Content-Type: application/ipp 

下 面 是 对 于 作者 使 用 的 Xerox Phaser 8560 打 印 机 的 打印 请 求 的 HTTP 
首部 样 例 。 

POST /ipp HTTP/1.1AM 

Content-Length: 21931AM 

Content-Type: application/ipp\M 

Host: phaser8560:631AM 

AM 

Content-Length 行 指明 了 HTTP 报 文中 数据 的 字 节 大 小 。 这 个 长 度 不 
包含 了 HTTP 首 部 的 大 小 ， 但 包括 IPP 首 部 的 大 小 。Host 行 指明 了 要 发 送 
报 文 的 服务 右 主 机 名 称 和 端口 号 。 

每 行 后 面 的 AM 是 换行 符 前 的 回 车 符 。 换 行 符 不 能 被 显示 成 可 打印 
字符 。 注 意 ， 首 部 的 最 后 一 行 是 空 的 ， 只 有 回 车 和 换行 符 。 

HTTP 啊 应 报 文 的 起 始 行 包含 了 版 本 字符 串 ， 紧 接着 的 是 一 个 数字 
状态 码 和 状态 信息 ， 最 后 以 一 个 回 车 和 换行 结束 。HTTP 啊 应 报 文 的 剩 
ae te 首部 之 后 是 一 个 空白 行 和 可 选 的 实体 主 


打印 机 需要 发 送 给 我 们 如 下 的 报 文 作为 打印 请 求 的 回应 : 
HTTP/1.1 200 OK M 
Content-Type: application/ipp M 











Cache-Control: no-cache, no-store, must-revalidate M 

Expires: THU, 26 OCT 1995 00:00:00 GMTM 

Content-Length: 215°M 

Server: Allegro-Software-RomPager/4.34°"M 

“M 

对 于 打印 假 脱 机 守护 进程 ， 我 们 只 关心 报 文 的 第 一 行 : 它 说 明了 请 
求 成 功 或 者 用 数字 错误 码 以 及 一 个 短 字 符 串 表示 请 求 失败 。 剩 下 的 报 文 
包含 了 附加 信息 ， 可 以 通过 在 客户 端 和 服务 器 间 的 市 点 来 控制 缓存 以 及 
表明 运行 在 服务 器 上 的 软件 版 本 号 。 





21.4 4J EN {E ji \ 


本 章 中 我 们 开发 的 程序 是 一 个 基本 的 打印 假 脱 机 守护 进程 。 一 个 简 
单 的 用 户 命 令 发 送 一 个 文件 到 打印 假 脱 机 守护 进程 ， 假 脱 机 守护 进程 将 
其 保存 到 磁盘 ， 将 请 求 送 入 队列 ， 最 终 将 文件 发 送 到 打印 机 。 

所 有 的 UNIX 系 统 至 少 提 供 一 个 打印 假 脱 机 系统 。FreeBSD 安 装 的 
是 BSD 的 打印 假 脱 机 系统 LPD (参见 lpd(8) 和 Stevens ”[1990] 第 13 章 ) 。 
Linux 和 Mac OS X 包 括 CUPS， 即 Common UNIX Printing System (参见 
cupsd(8)) 。 Solaris 提 供 标准 的 System V 打 印 假 脱 机 守护 进程 (参见 lp(1) 
Alllpsched(1M)) 。 在 本 章 中 ， 我 们 的 兴趣 不 在 于 这 些 假 脱 机 系统 本 身 ， 
而 是 如 何 与 网 络 打印 机 通信 。 我 们 需要 开发 一 个 假 脱 机 系统 能 够 解决 多 
用 户 访问 单一 资源 (打印 机 〉 问题 。 

我 们 使 用 一 个 简单 的 命令 行程 序 读 取 一 个 文件 ， 将 其 送 到 打印 假 脱 
机 守护 进程 。 这 个 命令 行程 序 由 一 个 选项 来 强制 将 文件 按照 文本 来 处 理 
(默认 是 PostScript 文 件 ) 。 这 个 命令 行程 序 是 print。 

在 我 们 的 打印 假 脱 机 守护 进程 printd 中 ， 使 用 多 线程 将 任务 分 解 给 
TI Re 

“一 个 线程 在 套 接 字 上 监听 从 运行 print 的 客户 端 发 来 的 新 打印 请 


对 于 每 个 客户 端 产 生 一 个 独立 的 线程 ， 将 要 打印 的 文件 复制 到 假 
脱 机 区 域 。 

一 个 线程 与 打印 机 通信 ， 一 次 发 送 一 个 队列 中 的 作业 。 

“一 个 线程 处 理 信 号 。 

图 21-6 显 示 如 何 将 这 些 组 件 整 合 在 一 起 。 

打印 配置 文件 是 /etc/printer.conf。 这 个 文件 标识 了 运行 打印 假 脱 机 
守护 进程 的 服务 器 主机 名 和 网 络 打印 机 的 主机 名 。 以 printserver 关键 字 
开始 的 行 标 识 了 假 脱 机 守护 进程 。 以 printer 关 键 字 开始 的 行 标 识 了 打印 
机 ， 空 格 符 之 后 跟着 打印 机 的 主机 名 。 











printd 


打印 假 脱 机 





等 待 打印 文件 队列 


图 21-6 打印 假 脱 机 组 件 

一 个 打印 机 配置 文件 样 例 可 能 包含 下 列 行 : 

printserver fujin 

printer phaser8560 

其 中 和 jin 是 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 主机 名 ， 
phaser8560 是 网 络 打 印 机 的 主机 名 。 我 们 假设 这 些 名 字 已 经 在 /etc/hosts 
中 列 出 或 者 已 经 通过 正在 使 用 的 任意 服务 进行 了 注册 ， 这 样 我 们 就 可 以 
将 这 些 名 字 转 换 成 网 络 地 址 。 

可 以 在 运行 打印 假 脱 机 守护 进程 的 同一 台 机 器 上 运行 print 命令 ， 
也 可 以 在 同一 个 网 络 中 的 任意 机 器 上 运行 它 。 我 们 只 需 配 置 
在 /etc/printer.conf 中 的 printserver 字段 即 可 ， 因 为 只 有 守护 进程 需要 知 
省 打印 机 名 称 。 


女 

拥有 超级 用 户 特权 的 程序 可 能 让 计算 机 系统 受到 攻击 。 这 些 程序 通 
常 并 不 比 其 他 程序 更 脆弱 ， 但 是 被 攻破 时 将 导致 攻击 者 能 够 完全 访问 你 
的 计算 机 系统 。 

本 章 中 的 打印 假 脱 机 守护 进程 拥有 超级 用 户 特权 ， 在 这 个 例子 中 能 
够 将 一 个 特权 TCP 站 口号 绑 定 一 个 套 接 字 。 为 了 使 守护 进程 能 更 好 地 抵 
御 攻 击 ， 我 们 可 以 : 

"按照 最 少 特权 的 原则 (8.11 $) 设计 守护 进程 。 我 们 获得 一 个 绑 





定 到 特权 器 口 的 套 接 字 之 后 ， 可 以 将 守护 进程 的 用 户 ID 和 组 的 ID 更 改 为 
非 root (如 lp〉。 所 有 用 于 存储 队列 中 打印 作业 的 文件 和 目录 的 拥有 者 
应 该 是 非特 权 用 户 。 如 果 被 攻击 ， 这 种 情况 下 攻击 者 只 能 通过 守护 进程 
访问 打印 子 系统 。 昌 然 这 仍然 是 一 个 隐患 ， 但 是 比 起 攻击 者 可 以 完全 访 
问 系统 ， 其 危害 性 已 大 大 降低 了 。 

"审计 守护 进程 源 代码 中 所 有 已 知 的 潜在 脆弱 性 漏洞 ， 如 缓冲 区 洲 


出 。 
"对 不 期 望 或 者 可 疑 的 行为 做 日 志 ， 这 样 可 以 引起 管理 员 注 意 并 进 


一 步调 查 。 


21.5 RNAS 


as 本 章 的 源 代 码 有 5 个 文件 ， 不 包括 在 前 面 章 节 中 所 用 的 一 些 公共 库 
列 程 。 

ipp.h 包含 IPP 定 义 的 头 文 件 。 

printh 包含 公用 的 常数 、 数 据 结构 定义 以 及 实用 工具 例 程 的 声明 的 
ALTE 

util.c 用 于 两 个 程序 的 实用 工具 例 程 。 

用 于 打印 文件 的 命令 行程 序 C 代 码 。 

printd.c 用 于 打印 假 脱 机 守护 进程 的 C 代 码 。 我 们 按照 所 列 次 序 依 次 
DBT EER FF 0 

首先 从 ipp.h 头 文件 开始 。 

print.c 

1 #ifndef _IPP_H 

2 #define IPP H3/* 

4 * Defines parts of the IPP protocol between the scheduler 

5 * and the printer. Based on RFC2911 and RFC2910. 

6 */ 

Lf 

8 * Status code classes. 

9g:*/ 

10 #define STATCLASS_OK(x) ((x) >= 0x0000 && (x) <= 
0x00ff) 

11 #define STATCLASS_INFO(x) ((x) >= 0x0100 && (x) <= 
Ox01ff) 

12 #define STATCLASS_REDIR(x) ((x) >= 0x0300 && (x) <= 0x03ff) 

13 #define STATCLASS CLIERR(x) ((x) >= 0x0400 && (x) <= 
0x04ff) 

14 #define STATCLASS SRVERR(x) ((x) >= 0x0500 && (x) <= 
Ox05ff) 

15 /* 

16 * Status codes. 

17 */ 

18 #define STAT_OK 0x0000 /* success */ 











19 #define STAT_OK_ATTRIGN 0x0001 /* OK; some attrs ignored */ 

20 #define STAT OK _ATTRCON 0x0002 /* OK; some attrs conflicted 
a 

21 #define STAT_CLI_BADREQ 0x0400 /* invalid client request */ 

22 #define STAT_CLI_FORBID 0x0401 /* request is forbidden */ 

23 #define STAT_CLI_NOAUTH 0x0402 /* authentication required */ 

24 #define STAT_CLI_NOPERM 0x0403 /* client not authorized */ 

25 #define STAT_CLI_NOTPOS 0x0404 /* request not possible */ 

26 #define STAT_CLI_TIMOUT 0x0405 /* client too slow */ 

27 #define STAT_CLI_NOTFND 0x0406 /* no object found for URI */ 

28 #define STAT_CLI_OBJGONE 0x0407 /* object no longer available 
*/ 

29 #define STAT_CLI_TOOBIG 0x0408 /* requested entity too big */ 

30 #define STAT_CLI_TOOLNG 0x0409 /* attribute value too large */ 

31 #define STAT_CLI_BADFMT 0x040a /* unsupported doc format */ 

32 #define STAT_CLI_NOTSUP 0x040b /* attributes not supported */ 

33 #define STAT_CLI_NOSCHM 0x040c /* URI scheme not supported 
g 

34 #define STAT_CLI_NOCHAR 0x040d /* charset not supported */ 

35 #define STAT_CLI_ATTRCON 0x040e /* attributes conflicted */ 

36 #define STAT_CLI_NOCOMP 0x040f /* compression not supported 
z 

37 #define STAT_CLI_COMPERR 0x0410 /* data can't be 
decompressed */ 

38 #define STAT_CLI_FMTERR 0x0411 /* document format error */ 

39 #define STAT_CLI_ACCERR 0x0412 /* error accessing data */ 

[1~14] ipp.h 从 标准 的 者 fdef 开 始 ， 用 于 防止 同一 文件 被 包含 两 次 的 

普 误 。 然 后 定义 IPP 状 态 码 的 类 参见 RFC 2911 的 第 13 节 ) 。 

[15 一 39] 定义 基于 RFC 2911 的 状态 码 ， 但 是 本 程序 不 使 用 ， 这 些 状 
态 人 码 的 使 用 留 给 读者 作为 练习 (参见 习题 21.1) 。 

40 #define STAT_SRV_INTERN 0x0500 /* unexpected 
internal error */ 

41 #define STAT _SRV_NOTSUP 0x0501 /* operation not 
supported */42 #define STAT_SRV_UNAVAIL 0x0502 /* service 
unavailable */ 

43 #define STAT_SRV_BADVER 0x0503 /* version not 
supported */ 


44 #define STAT_SRV_DEVERR Ox0504 /* device error */ 

45 #define STAT_SRV_TMPERR 0x0505 /* temporary error */ 

46 #define STAT_SRV_REJECT Ox0506 /* server not 
accepting jobs */47 #define STAT_SRV_TOOBUSY 0x0507 /* server too 
busy */ 

48 #define STAT_SRV_CANCEL 0x0508 /* job has been 
canceled */ 

49 #define STAT _SRV_NOMULTI 0x0509 /* multi-doc jobs 
unsupported */ 


50 /* 

51 * Operation IDs 

52 */ 

53 #define OP_PRINT_JOB 0x02 

54 #define OP_PRINT_URI 0x03 

55 #define OP_VALIDATE_JOB 0x04 

56 #define OP_CREATE_JOB 0x05 

57 #define OP_SEND_DOC 0x06 

58 #define OP_SEND_URI 0x07 

59 #define OP_CANCEL JOB 0x08 

60 #define OP_GET_JOB_ATTR 0x09 

61 #define OP_GET_JOBS Ox0a 

62 #define OP_GET_PRINTER_ATTR 0x0b 

63 #define OP_HOLD_JOB 0x0c 

64 #define OP_RELEASE_JOB Ox0d 

65 #define OP_RESTART_JOB 0x0e 

66 #define OP_PAUSE_PRINTER 0x10 

67 #define OP_RESUME_PRINTER 0x11 

68 #define OP_PURGE_JOBS 0x12 

69 /* 

70 * Attribute Tags. 

71 */ 

72 #define TAG_OPERATION_ATTR 0x01 /* operation 
attributes tag */ 

73 #define TAG_JOB_ATTR 0x02 /* job attributes tag 
g 

74 #define TAG_END_OF_ATTR 0x03 /* end of 


attributes tag */ 


75 #define TAG_PRINTER_ATTR 
tag */ 

76 #define TAG _UNSUPP_ATTR 
attributes tag */ 

[40~49] 


0x04 /* printer attributes 


0x05 /* unsupported 


继续 定义 状态 码 。0x500 一 0x5ff 是 服务 器 错误 码 。REFC 


2911 中 13.1.1 节 至 13.1.5 节 描述 了 所 有 的 状态 码 。 


[50~68] 


接着 定义 各 种 操作 ID。IPP 中 定义 的 每 个 操作 有 一 个 


ID (参见 RFC 2911 的 4.4.15 节 ) 。 在 本 例 中 ， 仅 用 到 打印 作业 操作 。 








[69 一 76] 
定义 在 RFC 2910 的 3.5.1 节 。 

77 /* 

78 * Value Tags. 

79 */ 

80 #define TAG_UNSUPPORTED 
value */ 

81 #define TAG UNKNOWN 
value */ 


82 #define TAG_NONE 

83 #define TAG_INTEGER 

84 #define TAG_BOOLEAN 

85 #define TAG ENUM 

86 #define TAG_OCTSTR 

87 #define TAG_DATETIME 
88 #define TAG_RESOLUTION 
89 #define TAG_INTRANGE 


属性 标志 限定 了 IPP 中 请 求 和 响应 报 文 的 属性 组 。 这 些 值 


0x10 /* unsupported 


0x12 /* unknown 
0x13 /*no value */ 
0x21 /* integer */ 
0x22 /* boolean */ 
0x23 /* enumeration */ 
0x30 /* octetString */ 
0x31 /* dateTime */ 
0x32 /* resolution */ 
0x33 /* rangeOfInteger 


*/ 

90 #define TAG_TEXTWLANG 0x35 /* 
textWithLanguage */ 

91 #define TAG_NAMEWLANG 0x36 /* 
nameWithLanguage */ 

92 #define TAG_TEXTWOLANG 0x41 /* 
textWithoutLanguage */ 

93 #define TAG_NAMEWOLANG 0x42 /* 


nameWithoutLanguage */ 
94 #define TAG KEYWORD 
95 #define TAG_URI 
96 #define TAG_URISCHEME 


0x44 /* keyword */ 


0x45 /* URI */ 


0x46 /* uriScheme */ 


97 #define TAG_CHARSET 0x47 /* charset */ 


98 #define TAG _NATULANG 0x48 /* 
naturalLanguage */ 

99 #define TAG_MIMETYPE 0x49 /* mimeMediaType 
T 

100 struct ipp_hdr { 

101 int8_t major version; /* always 1 */ 

102 int8_t minor version; /* always 1 */ 

103 union { 

104 int16_t op; /* operation ID */ 

105 int16_t st; /* status */ 

106 tu 


107 int32_t request_id; /* request ID */ 

108 char attr_group[1]; /* start of optional attributes group */ 

109 /* optional data follows */ 

110 }; 

111 #define operation u.op 

112 #define status u.st 

113 #endif /* _IPP_H */ 

[77~99] 值 标志 指示 每 个 属性 和 参数 的 格式 ， 由 RFC 2910 的 3.5.2 节 
定义 。[100 一 113] 定义 IPP 首 部 的 结构 。 请 求 报 文 与 啊 应 报 文 的 首部 一 
样 ， 除 了 请 求 中 的 操作 ID 被 啊 应 中 的 状态 码 代 蔡 。 在 头 文件 尾部 我 们 用 
#endif 来 匹配 文件 开始 的 大 fdef 。 

下 一 个 文件 是 print.h 头 文件 。 

1 #ifndef _PRINT_H 

2 #define _PRINT_H 

3/* 

4 * Print server header file. 

5 */ 

6 #include <sys/socket.h> 

7 #include <arpa/inet.h> 








8 #include <netdb.h> 

9 #include <errno.h> 

10 #define CONFIG_FILE "/etc/printer.conf" 
11 #define SPOOLDIR "/var/spool/printer" 
12 #define JOBFILE "jobno" 


13 #define DATADIR "data" 


14 #define REQDIR "reqs" 

15 #if defined(BSD) 

16 #define LPNAME "daemon" 

18 #define LPNAME "Ip" 

20 #define LPNAME "Ip" 

17 #elif defined((MACOS) 

19 #else 

21 #endif 

[1 一 9] 在 这 个 头 文件 中 包含 所 需要 的 所 有 头 文 件 。 应 用 程序 只 需 简 
单 地 包含 printh， 而 不 需要 跟踪 所 有 的 头 文 件 依赖 关系 。 

[10~14] 定义 实现 所 需 的 文件 和 目录 。 包含 打 印 守 护 进 程 和 网 络 打 
印 机 主机 名 的 配置 文件 在 /etc/printer.conf 中 。 需 要 打印 的 文件 副本 在 目 
录 /var/spool/printer/data 中 ; 对 于 每 个 请 求 的 控制 信息 在 目 
录 /vVar/spool/printer/reqs 中 。 包 含 下 一 个 作业 编号 的 文件 
是 /var/spool/printer/jobno。 

目录 必须 由 管理 员 创 建 并 且 由 运行 打印 守护 进程 的 账户 所 有 。 如 果 

这 些 目 录 不 存在 ， 守 护 进 程 也 不 会 创建 这 些 目录 ， 因 为 守护 进程 需要 

root 权限 来 创建 /var/spool 中 的 目录 。 我 们 的 设计 初 训 是 当 以 root 权 限 运 
行 时 ， 尽 量 让 守护 进程 少 做 一 些 事情 ， 以 减少 产生 安全 漏洞 的 可 能 。 

[15~21]) ”接着 定义 运行 打印 守护 进程 的 账户 名 。 在 Linux 和 Solaris 
中 ， 这 个 账户 名 是 jp。 在 Mac OS X 中 ， 上 账户 名 是 lp。FreeBSD 没 有 为 打 
印 守 护 进 程 定义 单独 的 账户 ， 所 以 我 们 使 用 为 系统 守护 进程 保留 的 账 
户 。 


pn 




















22 #define FILENMSZ 64 

23 #define FILEPERM (S_IRUSR|S_IWUSR) 
24 #define USERNM MAX 64 

25 #define JOBNM MAX 256 

26 #define MSGLEN_MAX 512 

27 #ifndef HOST_NAME_MAX 

28 #define HOST_NAME_MAX 256 


29 #endif 

30 #define IPP PORT 631 

31 #define QLEN 10 

32 #define IBUFSZ 512 /* IPP header buffer size */ 

33 #define HBUFSZ 512 /* HTTP header buffer size */ 
34 #define IOBUFSZ 8192 /* data buffer size */ 


35 #ifndef ETIME 


36 #define EIIME ETIMEDOUT 

37 #endif 

38 extern int getaddrlist(const char *, const char *, 

39 struct addrinfo **); 

40 extern char *get_printserver(void); 

41 extern struct addrinfo *get_printaddr(void); 

42 extern ssize_t tread(int, void *, size_t, unsigned int); 

43 extem ssize_t treadn(int, void *, size_t, unsigned int); 

44 extern int connect_retry(int, int, int, const struct sockaddr *, 

45 socklen_t); 

47 int); 

46 extern int initserver(int, const struct sockaddr *, socklen_t, 

[22 一 34] 接 下 来 定义 限制 和 常量 。FILEPERM 是 创建 要 打印 的 文件 
副本 使 用 的 权限 。 这 个 权限 是 被 限制 的 ， 因 为 我 们 不 希望 普通 用 户 在 等 
待 打印 时 能 够 读 取 他 人 的 文件 。 我 们 定义 HOST_NAME_MAX 作 为 用 
sysconf 不 能 够 确定 系统 的 限制 时 能 够 文 持 的 最 大 的 主机 名 。 

IPP 被 定义 为 使 用 端口 631。QLEN 是 传递 给 listen 的 backlog 参 数 ( 具 
体 细 节 见 16.4 节 ) 。[35 一 37] 一 些 平台 没有 定义 错误 码 ETIME， 因 此 男 
外 定义 一 个 错误 码 ， 使 得 在 这 些 系 统 上 有 意义 。 当 读 超 时 时 ， 返 回 这 个 
错误 码 ( 我 们 不 希望 在 从 套 接 字 读 的 时 候 服 务 器 无 限期 地 阻 寨 〉。 

[38 一 47] 接着 ， 定 义 所 有 包含 在 util.c 中 的 公共 例 程 ( 稍 后 将 分 析 这 
些 例 程 》。 注 意 ， 图 16-11 中 的 connect_retry 消 数 和 图 16-22 中 的 initserver 
函数 没有 包含 在 util.c 中 。 


48 /* 

49 * Structure describing a print request. 

50 */ 

51 struct printreg { 

52 uint32_t size; /* size in bytes */ 

53 uint32_t flags; /* see below */ 

54 char usernm| USERNM_ MAX]; /* user’s name */ 
55 char jobnm[JOBNM_MAX]; /* job’s name */ 
56 }; 

DY/ 

58 * Request flags. 

59 */ 

60 #define PR_TEXT 0x01 /* treat file as plain 


text */ 


61 /* 

62 * The response from the spooling daemon to the print command. 
63 */ 

64 struct printresp { 


65 uint32_t retcode; /* 0=success, !0=error code 
my, 

66 uint32_t jobid; /* job ID */ 

67 char msg[ MSGLEN_MAX]; /* error message */ 

68 }; 


69 #endif /* _PRINT_H */ 

[48~69] printreq 结 构 和 printresp 结 构 定义 了 print 程 序 和 打印 假 脱 机 
守护 进程 之 则 的 协议 。print 程 序 发 送 printreq 结 构 到 打印 假 脱 机 守护 进 
程 ， 该 结构 定义 了 作业 大 小 以 字 市 为 单位 ， 、 作 业 性 质 、 用 户 名 和 作 
业 名 。 打 印 假 脱 机 守护 进程 用 printresp 结 构 回 应 ， 该 结构 包括 返回 码 、 
作业 ID 和 错误 消息 (如 果 请 求 失 败 〉。 

PR_TEXT 作 业 性 质 表 明 要 打印 的 文件 只 能 被 视 为 纯 文本 而 不 是 
PostScript〉。 我 们 为 所 有 的 标志 定义 一 个 掩 码 而 非 对 每 个 标志 定义 一 个 
独立 的 字段 。 尽 管 目 前 只 定义 了 一 个 标志 值 ， 将 来 还 可 以 增加 更 多 性 质 
来 扩展 这 个 协议 。 例 如 ， 我 们 可 以 在 增加 一 个 标志 位 用 来 请 求 双 面 打 
印 。 不 需要 改变 结构 的 大 小 就 可 以 有 31 个 额外 的 标志 位 的 空间 。 改 变 结 
构 的 大 小 意味 着 可 能 会 引入 客户 端 和 服务 器 的 兼容 性 问题 ， 除 非 对 两 边 
同时 更 新 。 男 一 个 可 选 方 案 就 是 增加 一 个 报 文 版 本 写 ， 以 允许 不 同 版 本 
的 结构 有 所 改变 。 

注意 ， 对 协议 结构 中 的 所 有 整数 显 式 地 定义 了 一 个 长 度 ， 这 可 以 在 
客户 并 与 服务 器 的 整数 长 度 不 同时 避免 错位 的 结构 元 素 。 

下 一 个 文件 我 们 考察 util.c， 该 文件 包含 实用 工具 例 程 。 

1 #include "apue.h" 

2 #include "print.h" 

3 #include <ctype.h> 

4 #include <sys/select.h> 

5 #define MAXCFGLINE 512 

6 #define MAXKWLEN 16 

7 #define MAXFMTLEN 16 

8 /* 

9 * Get the address list for the given host and service and 

10 * return through ailistpp. Returns 0 on success or an error 

11 * code on failure. Note that we do not set errno if we 








12 * encounter an error. 


13 * 


14 * LOCKING: none. 


15 */ 
16 int 


17 getaddrlist(const char *host, const char *service, 
18 struct addrinfo **ailistpp) 


19 { 


20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 


32 } 
[1~7] 


int erT; 

struct addrinfo hint; 

hint.ai_flags = AI CANONNAME; 
hint.ai_family = AF_INET; 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_protocol = 0; 

hint.ai_addrlen = 0; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 

hint.ai_next = NULL; 

err = getaddrinfo(host, service, &hint, ailistpp); 
return(err); 


首先 定义 了 这 个 文件 中 函数 中 的 限制 。MAXCFGLINE 是 打 


印 机 配置 文件 的 行 的 最 大 长 度 、MAXKWLEN 是 配置 文件 中 关键 字 的 最 
大 长 度 、MAXFMTLEN 是 传 给 sscanf 的 格式 化 字符 串 的 最 大 长 度 。 

[8 一 32] ”第 一 个 函数 是 getaddrlist， 是 getaddrinfo 〈16.3.3 节 ) WE 
装 ， 因 为 我 们 第 党 用 同样 的 结构 来 调用 getaddrinfo。 注 意 ， 在 这 个 函数 
中 不 需要 互 斥 锁 。 每 个 函数 前 面 的 LOCKING 注释 是 用 于 多 线程 锁定 的 
文档 编写 。 这 一 注释 列 出 了 可 能 的 关于 锁 的 假设 ， 告 知 该 函数 所 需要 获 
得 或 释放 的 锁 ， 并 告知 调用 这 个 函数 所 需要 持 有 的 锁 。 


33 /* 


34 * Given a keyword, scan the configuration file for a match 
35 * and return the string value corresponding to the keyword. 


36 * 


37 * LOCKING: none. 


38 */ 


39 static char * 
AO scan_configfile(char *keyword) 


41 1{ 


42 int n, match; 

43 FILE *fp; 

44 char keybuf[MAXKWLEN], 
pattern[MAXFMTLEN]; 

45 char line[MAXCFGLINE]; 


46 Static char valbuf[MAXCFGLINE]; 

47 if (fp = fopen(CONFIG_FILE, "r")) == NULL) 

48 log_sys("can't open %s", CONFIG_FILE); 

49 sprintf(pattern, "%%%ds %%%ds", MAXKWLEN-1, 
MAXCFGLINE-1); 

50 match = 0; 

51 while (fgets(line, MAXCFGLINE, fp) != NULL) { 


52 n = sscanf(line, pattern, keybuf, valbuf); 

53 if (n == 2 && strcmp(keyword, keybuf) == 0) { 
54 match = 1; 

55 break; 

56 } 

57 } 


58 fclose(fp); 
59 if (match != 0) 


60 return(valbuf); 
61 else 

62 return(NULL); 
63 } 


[33~46] scan_configfile 函 数 搜索 打印 机 配置 文件 中 指定 的 关键 字 。 

[47 一 63] 以 读 方式 打开 配置 文件 ， 根 据 搜索 模式 建立 格式 字符 串 。 
从 写 %%%ds 建立 一 个 格式 指示 喜来 限定 字符 串 长 度 ， 这 样 在 栈 中 存放 
字符 串 的 缓冲 区 就 不 会 洪 出 。 在 文件 中 一 次 读 取 一 行 ， 并 且 扫 描 被 空格 
符 分 开 的 两 个 字符 串 ， 如 果 找 到 它们 ， 就 用 关键 字 与 第 一 个 字符 串 比 
较 。 如 果 找 到 一 个 匹配 或 者 读 到 文件 尾 ， 则 循环 结束 并 关闭 文件 。 如 果 
关键 字 逻 配 ， 则 返回 一 个 指向 包含 关键 字 后 面 的 字符 串 的 缓冲 区 的 指 
针 ; 否则 返回 NULL。 返 回 的 字符 串 存 放 在 静态 缓冲 区 Cvalbuf) 中 ， 
该 缓冲 区 会 被 紧 接 的 调用 履 盖 。 因 此 ，scan_configfile 不 能 用 于 多 线程 
程序 ， 除 非 能 够 小 心地 避免 同时 有 多 个 线程 调用 它 。 

64 /* 

65 * Return the host name running the print server or NULL on error. 














66 * 
67 * LOCKING: none. 


68 */ 

69 char * 

70 get_printserver(void)71 { 

72 return(scan_configfile("printserver")); 
73 } 

74 /* 


75 * Return the address of the network printer or NULL on error. 
76 * 

77 * LOCKING: none. 

78 */ 

79 struct addrinfo * 

80 get_printaddr(void)81 { 


82 int elt; 

83 char *D; 

84 struct addrinfo *ailist; 

85 if ((p = scan_configfile("printer")) != NULL) { 

86 if ((err = getaddrlist(p, "ipp", &ailist)) != 0) { 

87 log_msg("no address information for %s", p); 
88 return(NULL); 

89 

90 return(ailist); 

91 } 


92 log_msg("no printer address specified"); 

93 return(NULL); 

94 } 

[64~73] get_printserver 仅仅 是 一 个 简单 的 函数 封装 函数 ， 它 通过 
调用 scan_configfile 找 到 运行 打印 假 脱 机 等 护 进程 的 计算 机 系统 名 。 

[74 一 94] 使 用 get_printaddr 函数 找到 网 络 打 印 机 的 地 址 。 除 了 通过 
中 的 打印 机 名 找到 相应 的 网 络 地 址 之 外 ， 该 函数 与 前 面 的 函数 
类 似 。 

get_printserver 和 get_printaddr 均 调用 scan_configfile。 如 果 不 能 打开 
打印 机 配置 文件 ，scan_configfile 就 调用 log_sys 打 印 出 错 消息 并 退出 。 
尽管 get_printserver 由 客户 端 命 令 调 用 ，get_printaddr 由 守护 进程 程序 调 
用 ， 但 两 者 均 可 调用 log_sys， 因 为 通过 设置 一 个 全 局 变量 可 以 安排 日 
志 函 数 将 其 打印 到 标准 错误 ， 而 不 是 输出 到 日 志文 件 。 


95 /* 

96 * "Timed" read - timout specifies the # of seconds to wait before 
97 * giving up (5th argument to select controls how long to wait for 
98 * data to be readable). Returns # of bytes read or -1 on error. 


99 * 

100 * LOCKING: none. 

101 */ 

102 ssize_t 

103 tread(int fd, void *buf, size_t nbytes, unsigned int timout) 
104 { 

105 int nfds; 

106 fd_set readfds; 

107 struct timeval tv; 

108 tv.tv_sec = timout; 


109 tv.tv_usec = 0; 

110 FD_ZERO(&readfds); 

111 FD_SET(fd, &readfds); 

112 nfds = select(fd+1, &readfds, NULL, NULL, &tv); 
113 if (nfds <= 0) { 


114 if (nfds == 0) 

115 errno = ETIME; 
116 return(-1); 

117 } 

118 return(read(fd, buf, nbytes)); 
119 } 








([95~107] tread en Bose AL, FERED AT 2% BASE 
timout 秒 。 当 我 们 从 一 个 套 接 字 或 一 个 管道 读数 据 时 这 个 函数 很 有 用 。 
如 果 在 指定 的 时 间 期 限 内 没有 接收 数据 ， 返回 -1 F emo “KA 
ETIME。 如 果 在 时 间 期 限 内 有 数据 可 用 ， 返 回 最 多 nbytes 字 节 的 数据 ， 
但 是 如 果 数 据 没 有 及 时 到 达 ， 我 们 可 以 返回 比 要 求 的 少 的 数据 。 我 们 用 
tread 在 打印 假 脱 机 守护 进程 上 防止 拒绝 服务 攻击 。 一 个 恶意 用 户 可 能 
复 和 尝试 连接 到 和 守护 进程 而 不 发 送 数据 ，/ 只 是 为 了 阻止 其 他 用 户 提 交 打印 
作业 。 通 过 一 个 合理 时 间 内 放弃 的 方式 ， 我 们 防止 这 种 情况 发 生 。 其 巧 
妙 之 处 在 于 选择 一 个 合理 的 超时 值 ， 当 系统 负载 比较 低 和 任务 花费 更 长 
上 人 够 防止 过 早 天 折 。 如 果 我 们 选择 的 值 太 大 ， 通 过 
a 可 能 导致 拒绝 服务 攻 








[108 一 119] 使 用 select 等 竺 指定 的 文件 描述 符 可 读 。 如 果 在 要 读 取 
的 数据 可 用 之 前 超时 ， select 返 回 9， 这 种 情况 将 ermo 设 为 ETIME。 如 果 
Select 失败 或 超时 ， 返 回 -1; 否则 返回 任何 可 用 数据 。 

120 /* 

121 * "Timed" read - timout specifies the number of seconds to wait 

122 * per read call before giving up, but read exactly nbytes bytes. 

123 * Returns number of bytes read or -1 on error. 





124 * 

125 * LOCKING: none. 

126 */ 

127 ssize_t 

128 treadn(int fd, void *buf, size_t nbytes, unsigned int timout) 
129 { 

130 size_t nleft; 

131 ssize_t nread; 


132 nleft = nbytes; 
133 while (nleft > 0) { 


134 if ((nread = tread(fd, buf, nleft, timout)) < 0) { 

135 if (nleft == nbytes) 

136 return(-1); /* error, return -1 */ 

137 else 

138 break; /* error, return amount read 
so far */ 

139 } else if (nread == 0) { 

140 break; /* EOF */ 

141 

142 nleft -= nread; 

143 buf += nread;144 } 

145 return(nbytes - nleft); /* return >= 0 */ 

146 } 





[120~146] 还 提供 了 tread 的 变 体 treadn， 它 仅 读 取 指定 的 字 节 数 。 
这 和 14.7 节 中 描述 的 readn 类 似 ， 但 是 附加 了 一 个 超时 参数 。 

为 了 正好 读 取 nbytes 字 节 ， 必 须 进 行 多 次 read 调 用 。 其 困难 之 处 在 
于 尝试 将 单个 超时 值 应 用 到 多 个 read 调 用 。 这 里 不 想 用 闹钟 ， 因 为 在 多 
线程 应 用 中 信号 会 变 乱 ;， 也 不 能 依赖 系统 根据 select 的 返回 更 新 timeval 
结构 ， 以 指示 剩余 的 时 间 ， 因 为 许多 平台 不 支持 这 个 (14.5.1 节 ) 。 
此 ， 这 种 情况 需要 折 中 并 定义 一 个 超时 值 应 用 到 单独 的 read 调 用 。 它 限 








制 循环 中 每 次 迭代 的 等 待 时 间 ， 而 不 是 限制 总 的 等 待 时 间 。 

总 等 待 的 最 大 时 间 由 nbytesxtimout 秒 限定 〈 最 坏 情 况 下 ， 一 次 仅 接 
eae) 

用 neft 记录 要 读 取 的 剩余 字 节 数 。 如 果 tread 失败 并 在 上 一 个 迭代 
中 已 经 接收 到 数据 ， 则 停止 while 循 环 并 返回 读 取 的 字 节 数 ， 否 则 返回 
=A 

接 下 来 是 用 于 提交 打印 作业 的 命令 程序 。C 源 代码 文件 是 print.c。 

1 /* 

2 * The client command for printing documents. Opens the file 

3 * and sends it to the printer spooling daemon. Usage: 

4 * print [-t] filename 

5 */ 

6 #include "apue.h" 

7 #include "print.h" 

8 #include <fcntl.h> 

9 #include <pwd.h> 

10 /* 

11 * Needed for logging funtions. 

12 */ 

13 int log_to_stderr = 1; 

14 void submit_file(int, int, const char *, size_t, int); 





15 int 

16 main(int argc, char *argv[]) 

17 { 

18 int fd, sockfd, err, text, c; 
19 struct stat sbuf; 

20 char *host; 

21 struct addrinfo “*ailist, *aip; 

22 err = 0; 

23 text = 0; 

24 while ((c = getopt(argc, argv, "t")) != -1) { 
25 switch (c) { 

26 case 't': 

27 text = 1; 

28 break; 

29 case '?': 


30 err = 1; 


31 break; 

32 } 

33 } 

[1 一 14] 需要 定义 一 个 log_to_stderr 整 数 ， 通 过 这 个 整数 能 够 使 用 库 
中 的 日 志 函 数 。 如 果 该 整数 设 为 非 0 值 ， 错 误 消息 将 被 送 到 一 个 标准 错 
误 流 而 非 日 志文 件 中 。 尽 管 在 print.c 中 没有 使 用 任何 日 志 函 数 ， 但 将 
util.0 链 接 到 print.o 构 建 了 一 个 可 执行 的 Print 命令 ， 并 且 utilc 包 含 用 于 用 
户 命令 行程 序 和 守护 进程 的 函数 。 

[15 一 33] 支持 一 个 选项 ， 即 -t， 强 行使 文件 按照 文本 格式 打印 《而 
不 是 其 他 格式 ， 如 PostScript 格 式 ) 。 使 用 getopt 函 数 来 处 理 命令 选项 。 

34 if (err || (optind != argc - 1)) 

















35 err_quit("usage: print [-t] filename"); 

36 if ((fd = open(argv[optind], O_RDONLY)) < 0) 

37 err_sys("print: can't open %s", argv[optind]); 

38 if (fstat(fd, &sbuf) < 0) 

39 err_sys("print: can't stat %s", argv[optind]); 

40 if (IS_ISREG(sbuf.st_mode)) 

41 err_quit("print: %s must be a regular file\n", argv[optind]); 
42 /* 

44 */ 


43 * Get the hostname of the host acting as the print server. 
45 if ((host = get_printserver()) == NULL) 


46 err_quit("print: no print server defined"); 

47 if ((err = getaddrlist(host, "print", &ailist)) != 0) 

48 err_quit("print: getaddrinfo error: %s", gai_strerror(err)); 
49 for (aip = ailist; aip != NULL; aip = aip->ai_next) { 

50 if ((sfd = connect_retry(AF_INET, SOCK_STREAM, 0, 
51 aip->ai_addr, aip->ai_addrlen)) < 0) { 

52 err = errno; 


[34 一 41] 当 getopt 处 理 完 命令 选项 ， 将 变量 optind 设 为 指 问 第 一 个 
非 选 项 参数 的 下 标 。 

如 果 这 是 一 个 值 而 非 最 后 一 个 参数 的 下 标 ， 那 么 说 明 它 是 错误 的 参 
数 个 数 《〈 只 支持 一 个 非 选 项 参数 ) 。 错 误 处 理 包 括 : 检查 是 否 能 够 打开 
要 打印 的 文件 ;检查 是 否 是 一 个 常规 文件 (而 不 是 一 个 目录 或 者 其 他 类 
型 的 文件 ) 。 

[42 一 48] 通过 调用 util.c 中 的 get_printserver 隙 数 取 得 打印 假 脱 机 守护 
进程 名 ， 并 且 调 用 getaddrlist (也 在 util.c 中 ) 将 主机 名 转换 成 一 个 网 络 














地 址 。 

注意 ， 指 定 服 务 名 为 "print”。 在 系统 上 安装 打印 假 脱 机 守护 进程 
时 ， 需 要 确保 /etc/services 〈 或 等 价 的 数据 库 ) 有 打印 机 服务 的 条 目 。 当 
为 守护 进程 选择 一 个 端口 时 ， 最 好 选择 特权 端口 ， 以 防止 恶意 用 户 程序 
假装 成 一 个 打印 假 脱 机 守护 进程 ， 而 实际 上 是 要 偷 取 打 印 文件 的 副本 。 
这 意味 着 端口 号 应 小 于 1 024《〈 回 忆 16.3.4 节 ) ， 并 且 守 护 进程 运行 时 必 
须 具 有 超级 用 户 特 权 以 便 能 够 绑 定 一 个 保留 端口 。 

[49 一 52] 使 用 getaddrinfo 返 回 的 地 址 列表 来 尝试 连 车 接 到 守护 进程 ， 
然后 使 用 能 够 连接 的 第 一 个 地 址 发 送 文 件 到 守护 进程 。 








53 } else { 

54 submit_file(fd, sfd, argv[optind], sbuf.st_size, text); 
55 exit(0); 

56 } 

57 } 

58 err_exit(err, "print: can’t contact %s", host); 

59 } 

60 /* 

61 * Send a file to the printer daemon. 

62 */ 

63 void 

64 submit_file(int fd, int sockfd, const char *fname, size_t nbytes, 
65 int text) 

66 { 

67 int nr, nw, len; 

68 struct passwd *pwd; 

69 struct printreq req; 

70 struct printresp res; 

71 char buf[IOBUFSZ]; 

72 /* 

73 * First build the header. 

74 sat) 

75 if ((pwd = getpwuid(geteuid())) == NULL) { 

76 strcpy(req.usernm, "unknown"); 

77 } else { 

78 strncpy(req.usernm, pwd->pw_name, USERNM_MAX-1); 
79 req.usernm[USERNM_MAX-1] = ’\0’; 


[53 一 59] 如 果 能 够 连接 到 打印 假 脱 机 守护 进程 ， 则 调用 submit_file 
将 要 打印 的 文件 传送 到 守护 进程 ， 然 后 用 返回 值 0 表示 成 功 后 退出 。 如 
果 不 能 连接 到 任何 地 址 ， 那 么 束 调 用 err_exit 来 打印 错误 消息 并 且 返 回 1 
表示 失败 后 退出 〈 附 录 B 包 含 了 err_exit 的 源 代 码 和 其 他 错误 例 程 ) 。 

[60~80] submit_file 发 送 打印 机 请 求 到 守护 进程 并 读 取 响应 消息 。 
首先 ， 建 立 printreq 请 求 头 。 使 用 geteuid 来 获得 调用 者 的 有 效用 户 ID 并 将 
其 传 给 getpwuid 以 便 查找 在 系统 口令 文件 中 的 用 户 。 将 该 用 户 名 复制 到 
请 求 涉 。 如 果 不 能 识别 用 户 ， 在 请 求 首部 中 使 用 字符 串 "unknown"。 从 
口令 文件 中 复制 用 户 名 时 ， 为 避免 写 超 出 请 求 首 部 的 用 户 名 缓冲 区 ， 可 
以 使 用 stmcpy。 如 果 用 户 名 比 缓冲 区 长 ，stmcpy 不 会 在 缓冲 区 中 存储 终 
止 null 字 节 ， 因 此 我 们 需要 自己 来 做 。 

81 req.size = htonl(nbytes); 

82 if (text) 











83 req.flags = htonl(PR_TEXT); 

84 else 

85 req. flags = 0; 

86 if ((len = strlen(fname)) >= JOBNM_MAX) { 

87 i 

88 * Truncate the filename (+-5 accounts for the leading 

89 * four characters and the terminating null). 

90 */ 

91 strcpy(req.jobnm, "... "); 

92 strncat(req.jobnm, &fname[len-JOBNM_MAX+5], 
JOBNM_MAX-5); 

93 } else { 

94 strcpy(req.jobnm, fname); 

95 

96 /* 

97 * Send the header to the server. 

98 etl 


99 nw = writen(sockfd, &req, sizeof(struct printreq)); 
100 if (nw != sizeof(struct printreq)) { 


101 if (nw < 0) 

102 err_sys("can’t write to print server"); 

103 else 

104 err_quit("short write (%d/%d) to print server", 


105 nw, sizeof(struct printreq)); 


106 } 

[81~95] 将 要 打印 的 文件 转 成 网 络 字 节 序 后 ， 将 其 文件 长 度 保存 在 
请 求 首部 。 如 果 文 件 按 纯 文本 格式 打印 ， 在 请 求 首部 保存 PR_TEXT 标 
志 。 通 过 将 这 些 整 数 转化 成 网 络 字 节 序 ， 可 以 在 打印 假 脱 机 守护 进程 在 
其 他 计算 机 系统 运行 的 同时 在 客户 端 系 统 上 运行 print 命 令 。 那 么 ， 即 便 
这 些 系统 使 用 不 同 字 节 序 的 处 理 器 ， 这 些 命令 仍 可 运行 〈 在 16.3.1 节 讨 
论 过 字 节 序 ) 。 

将 作业 名 设 为 要 打印 的 文件 名 。 如 果 作 业 名 的 长 度 超出 了 报 文 所 能 
容纳 的 作业 名 字段 长 度 ， 那 么 仅 复制 可 容纳 的 作业 名 的 最 后 部 分 。 这 样 
束 有 效 地 将 作业 名 的 开头 部 分 截 去 ， 并 代入 省 略 符 ， 以 表示 该 字段 还 有 
更 多 的 字符 。 

[96 一 106] 然后 使 用 writen 将 请 求 头 发 送 到 守护 进程 〈 回 忆 一 下 我 们 
在 图 14-24 中 介绍 过 的 writen 函 数 ) 。writen 函 数 使 用 多 个 write 调用 来 
传输 指定 数量 的 数据 。 如 果 写 入 失败 或 者 传输 少 于 期 望 的 数据 ， 将 打印 








错误 消息 然后 退出 。 
107 /* 
108 * Now send the file. 
109 g 
110 while ((nr = read(fd, buf, IOBUFSZ)) != 0) { 
111 nw = writen(sockfd, buf, nr); 
112 if (nw != nr) { 
113 if Mw < 0) 
114 err_sys("can’t write to print server"); 
115 else 
116 err_quit("short write (%d/%d) to print server", 
117 nw, nr); 
118 } 
119 } 
120 hy 
121 * Read the response. 
122 */ 
123 if ((nr = readn(sockfd, &res, sizeof(struct printresp))) != 
124 sizeof(struct printresp)) 
125 err_sys("can’t read response from server"); 
126 if (res.retcode != 0) { 
127 printf("rejected: %s\n", res.msg); 


128 exit(1); 


129 } else { 

130 printf("job ID %ld\n", (long)ntohl(res.jobid)); 

131 } 

132 } 

[107~ 119] 将 首部 发 送 到 守护 进程 后 ， 发 送 要 打印 的 文件 。 同 时 读 
取 文 件 的 IOBUFSZ 字 节 并 用 writen 发 送 数 据 到 守护 进程 。 如 果 写 失败 
或 者 写 少 了 ， 那 么 就 打印 错误 信息 并 退出 。 

[120 一 132] 把 要 打印 的 文件 发 送 给 守护 进程 后 ， 读 取 守 护 进程 的 啊 
应 数据 。 如 果 请 求 失败 ， 返 回 码 Cretcode) 为 非 零 值 ， 并 且 将 响应 中 的 
本 文 形 式 的 错误 信息 打印 出 来 。 如 果 请 求 成 功 ， 将 打印 作业 ID， 用 户 此 
后 可 以 使 用 此 ID 引用 该 请 求 。 我 们 将 写 一 个 命令 取消 一 个 挂 起 的 打 
印 请 求 留 作 练习 ， 作 业 ID 可 以 用 于 取消 作业 请 求 ， 其 作用 是 从 打印 队列 
中 识别 要 删除 的 作业 ， 参 见习 题 21.5) 。 当 submin_file 返 回 到 main 函 数 
时 ， 退 出 ， 表 明 请 求 成 功 。 

注意 ， 一 个 成 功 的 守护 进程 啊 应 并 不 意味 着 打印 机 可 以 打印 该 文 
件 ， 仅 仅 意 味 着 守护 进程 成 功 地 将 其 加 入 到 打印 作业 队列 。 

现在 print 命 令 已 经 完全 了 解 过 了 。 我 们 要 看 的 最 后 一 个 C 源 代码 文 
件 是 打印 假 脱 机 守护 进程 。 

Lt 

2 * Print server daemon. 

3 */ 

4 #include "apue.h" 

5 #include <fcntl.h> 

6 #include <dirent.h> 

7 #include <ctype.h> 

8 #include <pwd.h> 

9 #include <pthread.h> 

10 #include <strings.h> 

11 #include <sys/select.h> 

12 #include <sys/uio.h> 

13 #include "print.h" 

14 #include "ipp.h" 

Lae 

16 * These are for the HTTP response from the printer. 

17 */ 

18 #define HTTP_INFO(x) ((x) >= 100 && (x) <= 199) 

19 #define HTTP_SUCCESS(x) ((x) >= 200 && (x) <= 299) 





20 /* 
21 * Describes a print job. 


22 */ 

23 struct job { 

24 struct job *next; /* next in list */ 

25 struct job *Drev; /* previous in list */ 

26 long jobid; /* job ID */ 

27 struct printreq req; /* copy of print request */ 
28 }; 

29 /* 

30 * Describes a thread processing a client request. 

31 */ 

32 struct worker_thread { 

33 struct worker thread *next; /* next in list */ 

34 struct worker_thread *prev; /* previous in list */ 
35 pthread_t tid; /* thread ID */ 
36 int sockfd; /* socket */ 
ar 


[1~19] 打印 假 胶 机 守护 进程 包括 前 面 看 到 的 IPP 头 文件 ， 因 为 守护 
进程 需要 用 这 个 协议 与 打印 机 通信 。HTTP_INFO 和 HTTP_SUCCESS 宏 
定义 了 HTTP 请 求 的 状态 (IPP 建 立 在 HTTP 之 上 ) 。RFC 2616 第 10 节 定 
义 了 HTTP 状 态 码 。 

[20 一 37] 假 脱 机 守护 进程 使 用 job 和 worker_thread 结 构 来 跟踪 相应 的 
打印 作业 和 接受 打印 请 求 的 线程 。 

38 /* 

39 * Needed for logging. 

40 */ 

41 int log_to_stderr = 0; 

42 /* 

43 * Printer-related stuff. 

44 */ 

45 struct addrinfo *printer; 

46 char *printer_name; 

47 pthread_mutex_t configlock = 
PTHREAD_ MUTEX_INITIALIZER; 

48 int reread; 

49 /* 





50 * Thread-related stuff. 


aL */ 

52 struct worker_thread *workers; 

53  pthread_mutex_t workerlock = 
PTHREAD_ MUTEX_INITIALIZER; 

54 sigset_t mask; 

55 /* 

56 * Job-related stuff. 

57 */ 

58 struct job *jobhead, *jobtail; 

59 int jobfd; 





[38~41] HEKA EE X log to_stderr%ġ Œ, F HMHO, 1 
日 志 消 息 发 送 到 系统 日 志 而 不 是 标准 错误 。 在 print.c 中 ， 即 使 在 用 户 命 
令 中 不 使 用 日 志 ， 也 定义 log_to_stderr 并 将 其 设置 为 1。 如 果 将 实用 工 
有 具 函数 拆 分 为 两 个 独立 的 文件 :一 个 用 于 服务 器 ， 另 一 个 用 于 客户 端 命 
令 ， 则 可 以 避免 这 种 情况 。 

[42 一 48] ”使 用 全 局 指针 变量 printer 来 保存 打印 机 的 网 络 地 址 。 在 
printer_name 中 保存 打印 机 的 主机 名 。configlock 用 于 防止 访问 reread 变 
量 ， 该 变量 用 来 表示 守护 进程 需要 再 次 恋 取 配置 文件 ， 原 因 可 能 是 管理 
员 改 变 了 打印 机 网 络 地 址 。 

[49 一 54] 接着 ， 定 义 与 线程 相关 的 变量 。 使 用 workers 作 为 双 问 链表 
的 头 部 ， 该 表 用 于 接收 来 自 客户 端的 文件 。 采 用 workerlock 互 斥 量 来 保 
护 该 表 。 变 量 mask 用 于 线程 的 信号 掩 码 。[55 一 59] ”对 于 挂 起 作业 的 链 
表 ， 定 义 jobhead 为 表 头 ，jobtail 为 表 尾 。 该 表 也 是 双 同 链表 ， 但 是 需要 
将 作业 加 入 到 表 尾 ， 所 以 需要 一 个 指针 来 记 住 表 尾 。 人 至 于 表 中 工作 者 线 
程 的 顺序 是 无 关 紧 要 的 。 因 此 可 以 将 它们 加 入 到 表 头 而 不 需要 记 住 尾 指 
针 。jobfd 是 作业 文件 的 文件 描述 符 。 



































60 int32 t nextjob; 

61 pthread_mutex_t joblock = 
PTHREAD_MUTEX_INITIALIZER; 

62 pthread_cond_t jobwait = 
PTHREAD_COND_INITIALIZER; 

63 /* 

64 * Function prototypes. 

65 */ 

66 void init_request(void); 


67 void init_printer(void); 


68 void update_jobno(void); 
69 int32_t get_newjobno(void); 


70 void add_job(struct printreg *, int32_t); 
71 void replace_job(struct job *); 

72 void remove_job(struct job *); 

73 void build_gonstart(void); 

74 void *client_thread(void *); 

75 void *printer_thread(void *); 

76 void *signal_thread(void *); 

77 ssize_t readmore(int, char **, int, int *); 
78 int printer_status(int, struct job *); 
79 void add_worker(pthread_t, int); 

80 void kill_workers(void); 

81 void client_cleanup(void *); 

82 /* 


83 * Main print server thread. Accepts connect requests from 
84 * clients and spawns additional threads to service requests. 
85 * 

86 * LOCKING: none. 


87 */ 

88 int 

89 main(int argc, char *argv[]) 

90 { 

91 pthread_t tid; 

92 struct addrinfo *ailist, *aip; 

93 int sockfd, err, i, n, maxfd; 
94 char *host; 

95 fd_set rendezvous, rset; 
96 struct sigaction sa; 

97 struct passwd *pwdp; 


[60~62] nextjob 是 接收 的 下 一 个 打印 作业 的 ID。 互 斥 量 joblock 保 
护 作 业 表 ， 同 时 还 有 jobwait 代 表 的 条 件 变量 。 

[63 一 81] 声明 此 文件 中 所 有 余下 的 函数 的 原型 。 提 前 做 好 这 些 工作 
可 以 使 得 在 文件 中 放置 函数 时 不 用 担心 函数 调用 的 顺序 。 

[82 一 97] 打印 假 脱 机 守护 进程 的 main 函数 执行 两 个 任务 : 初始 化 
守护 进程 然后 处 理 来 自 客 户 端的 连接 请 求 。 

98 if (argc != 1) 








99 err_quit("usage: printd"); 

100 daemonize("printd"); 

101 sigemptyset(&sa.sa_mask); 

102 sa.sa_flags = 0; 

103 sa.sa_handler = SIG_IGN; 

104 if (sigaction(SIGPIPE, &sa, NULL) < 0) 

105 log_sys("sigaction failed"); 

106 sigemptyset(&mask); 

107 sigaddset(&mask, SIGHUP); 

108 sigaddset(&mask, SIGTERM); 

109 if ((err = pthread_sigmask(SIG_BLOCK, &mask, NULL)) != 
0) 

110 log_sys("pthread_sigmask failed"); 

111 n = sysconf(_SC_HOST_NAME_MAX); 

112 if (n < 0) /* best guess */ 


113 n = HOST_NAME_MAX; 

114 if ((host = malloc(n)) == NULL) 

115 log_sys("malloc error"); 

116 if (gethostname(host, n) < 0) 

117 log_sys("gethostname error"); 

118 if ((err = getaddrlist(host, "print", &ailist)) != 0) { 

119 log_quit("getaddrinfo error: %s", gai_strerror(err)); 
120 exit(1); 

121 


} 

[98 一 100] 守护 进程 没有 任何 选项 《〈 唯 一 的 参数 是 命令 名 自身 ) ， 
所 以 如 果 arge 不 为 1， 调用 err_quit 打 印 错误 信息 然后 退出 。 调 用 图 13-1 
所 示 程 序 中 的 daemonize 函 数 成 为 一 个 守护 进程 。 在 此 之 后 ， 不 能 在 标 
准 错误 上 打印 错误 消息 ， 而 是 对 其 记录 日 志 。 

[101~110] 忽略 SIGPIPE。 接 下 来 将 要 写 套 接 字 文件 描述 符 ， 并 且 
不 想 让 写 错误 触发 SIGPIPE， 因 为 其 默认 动作 是 杀 死 进程 。 下 一 步 ， 设 
置 线程 信号 掩 码 ， 包 括 SIGHUP 和 SIGTERM。 创 建 的 所 有 进程 均 继 承 
这 个 信号 掩 码 。 使 用 SIGHUP 信号 告诉 守护 进程 再 次 读 取 配置 文件 ， 
SIGTERM 信号 告诉 守护 进程 执行 清理 工作 并 优雅 地 退出 。 

[111~117] 调用 sysconf 来 获取 主机 名 的 最 大 长 度 。 如 果 sysconf 失 败 
或 者 没有 定义 该 限制 ， 采 用 “HOST _ NAME MAX 作为 最 佳 选 择 。 有 
时 ， 平 台 已 经 定义 了 此 常量 ， 但 如 果 没 有 定义 ， 则 在 print.h 中 选择 属于 
自己 的 值 。 分 配 内 存 来 保存 主机 名 并 调用 gethostname 来 获取 。 

















[118 一 121] 接 下 来 ， 答 试 找到 用 于 守护 进程 提供 打印 假 脱 机 服务 的 
网 络 地 址 。 

122 FD_ZERO(&rendezvous); 

123 maxfd = -1; 

124 for (aip = ailist; aip != NULL; aip = aip->ai_next) { 


125 if ((sockfd = initserver(SOCK_STREAM, aip->ai_addr, 
126 aip->ai_addrlen, QLEN)) >= 0) { 

127 FD_SET(sockfd, &rendezvous); 

128 if (sockfd > maxfd) 

129 maxfd = sockfd; 

130 } 

131 } 

132 让 (maxfd == -1) 

133 log_quit("service not enabled"); 


134 pwdp = getpwnam(LPNAME); 
135 让 (pwdp == NULL) 


136 log_sys("can’t find user %s", LPNAME); 

137 if (pwdp->pw_uid == 0) 

138 log_quit("user %s is privileged", LPNAME); 

139 if (setgid(pwdp->pw_gid) < 0 || setuid(pwdp->pw_uid) < 0) 
140 log_sys("'can’t change IDs to user %s", LPNAME); 


141 init_request(); 

142 init_printer(); 

[122~131] 清 零 rendezvous 变 量 ， 该 变量 将 与 select 一 起 用 来 等 待 客 
户 端 连接 请 求 。 将 最 大 文件 摘 述 符 初 始 化 为 -1， 以 确保 所 分 配 的 第 一 个 
文件 描述 符 会 大 于 maxfd. 

对 于 每 个 需要 提供 服务 的 网 络 地 址 ， 调 用 initserver( 见 图 16-22) 来 
分 配 和 初始 化 一 个 套 接 字 。 如 果 initserver 成 功 ， 将 其 文件 描述 符 加 入 
fd_set; 如 果 访 描述 符 大 于 现 有 最 大 值 maxfd， 将 maxfd 设 为 该 摘 述 符 
值 。 

[132 一 133] 走 完整 个 addrinfo 结 构 列 表 后 ， 如 果 maxfd 仍 为 -1， 不 能 
启动 打印 假 脱 机 服务 ， 记 录 日 志 然 后 退出 。 

[134~140] 守护 进程 需要 超级 用 户 特 权 来 绑 定 一 个 套 接 字 到 保留 端 
口 。 完 成 绑 定 后 ， 通 过 将 用 户 ID 改 变 为 lp 的 用 户 ID〈 回 忆 21.4 市 的 安全 
方面 的 讨论 ) 降低 该 程序 特权 。 这 里 想 遵 循 最 小 特权 原则 ， 以 避免 在 守 
护 进 程 中 将 系统 暴露 给 任何 可 能 的 攻击 。 调 用 getpwnam 来 找到 与 用 户 ]p 
相关 的 口令 条 目 。 如 果 没 有 此 用 户 ， 或 者 p 具 有 超级 用 户 特权 ， 记 录 日 





























志 然 后 退出 。 人 否则 ， 调 用 setuid 将 实际 用 户 ID 和 有 效用 户 ID 改 为 pp 用户 
ID。 为 了 避免 暴露 系统 ， 如 果 不 能 减少 特权 ， 那 么 就 选择 不 提供 任何 服 
务 


[141~142] 调用 init_request 来 初始 化 作业 请 求 并 确保 只 有 一 个 守护 
进程 副本 正在 运行 。 调 用 init_printer 初 始 化 打印 机 信息 〈 稍 后 就 可 以 看 
到 这 两 个 函数 ) 。 

143 err = pthread_create(&tid, NULL, printer_thread, NULL); 

144 if (err == 0) 








145 err = pthread_create(&tid, NULL, signal_thread, NULL); 

146 if (err != 0) 

147 log_exit(err, "can’t create thread"); 

148 build_gonstart(); 

149 log_msg("daemon initialized"); 

150 for (;;) { 

151 rset = rendezvous; 

152 if (select(maxfd+1, &rset, NULL, NULL, NULL) < 0) 

153 log_sys("select failed"); 

154 for (i = 0; i <= maxfd; i++) { 

155 if (FD_ISSET(i, &rset)) { 

156 /* 

157 * Accept the connection and handle the 
request. 

158 */ 

159 if ((sockfd = accept(i, NULL, NULL)) < 0) 

160 log_ret("accept failed"); 

161 pthread_create(&tid, NULL, client_thread, 

162 (void *)((long)sockfd)); 

163 } 

164 } 

165 } 

166 exit(1); 

167 } 


[143~149] 创建 一 个 处 理 信 号 的 线程 和 一 个 与 打印 机 通信 的 线程 。 
(通过 限制 打印 机 只 与 一 个 线程 通信 ， 可 以 简化 与 打印 机 相关 的 数据 结 
构 的 锁定 。) 然后 调用 build_qonstart 在 /varspoolprinter 目 录 中 搜索 任何 
挂 起 的 作业 。 对 于 找到 的 每 个 作业 ， 将 建立 一 个 结构 ， 让 打印 机 线程 将 
该 作业 的 文件 送 到 打印 机 。 至 此 ， 完 成 守护 进程 的 设置 ， 因 此 记录 一 条 











日 志 消 轧 ， 表 明和 守护 进程 初始 化 成 功 完成 。 

[150~167] 将 rendezvous fd_set 结 构 复 制 到 rset， 然 后 调用 select 等 待 
其 中 的 一 个 文件 描述 符 变 为 可 读 。 必 须 复 制 rendezvous， 因 为 select 会 修 
改 传 入 的 fd_set 结 构 来 包含 满足 事件 的 文件 描述 符 。 既 然 服务 右 已 经 将 
套 接 字 初 始 化 完毕 ， 一 个 可 读 的 文件 描述 符 束 意味 着 一 个 连接 请 求 需要 
处 理 。 当 select 返 回 时 ， 检 碍 rset 来 获取 一 个 可 读 的 文件 描述 符 。 如 有 果 找 
到 一 个 ， 调 用 accept 接 受 该 请 求 。 如 果 失 败 ， 记 录 日 志 然 后 继续 检查 更 
多 的 可 读 文 件 描述 符 。 否 则 ， 创 建 一 个 线程 来 处 理 客户 端 请 求 。 主 线程 
main 一 直 循 环 ， 将 请 求 发 送 到 其 他 线程 处 理 ， 永 远 不 应 到 达 exit 语 句 。 

168 /* 

169 * Initialize the job ID file. Use a record lock to prevent 

170 * more than one printer daemon from running at a time. 

171 * 

172 * LOCKING: none, except for record-lock on job ID file. 

173 */ 

174 void 

175 init_request(void)176 { 

177 int n; 

178 char name[FILENMSZ]; 

179 sprintf(name, "%s/%s", SPOOLDIR, JOBFILE); 

180 jobfd = open(name, O_CREAT|O_RDWR, S_IRUSR|S_TWUSR); 

181 if (write_lock(jobfd, 0, SEEK_SET, 0) < 0) 











182 log_quit("daemon already running"); 
183 /* 

184 * Reuse the name buffer for the job counter. 
185 */ 

186 if ((n = read(jobfd, name, FILENMSZ)) < 0) 
187 log_sys("can’t read job file"); 

188 if (n == 0) 

189 nextjob = 1; 

190 else 

191 nextjob = atol(name); 

192 } 

[168 ~ 182] 函数 init_ request 做 两 件 事 : 在 作业 文 


件 /varvspoolprintevjobno 上 放 一 个 记录 锁 ， 然 后 读 该 文件 并 确定 下 一 个 
要 赋值 的 作业 编号 。 在 整个 文件 上 放置 一 把 写 锁 ， 表 明 守 护 进程 正在 运 
行 。 如 果 当 前 已 有 一 个 守护 进程 正在 运行 ， 想 局 动 另 外 一 个 打印 假 脱 机 











守护 进程 副本 ， 该 程序 将 无 法 获得 写 锁 ， 然 后 就 退出 。 因 此 ， 同 时 只 能 
有 一 个 守护 进程 在 运行 。《〈 图 13-6 中 使 用 过 这 种 技术 ， 在 14.3 贡 中 讨论 
过 write_ lock 宏 。) 

[183 一 192] 作业 文件 包含 一 个 ASCII 码 的 整数 字符 串 来 表示 下 一 个 
作业 编号 。 如 果 文 件 刚 创建 并 且 为 空 ， 那 么 将 nextjob 设 置 为 1。 否 则 ， 
使 用 atol 将 字符 串 转换 为 整数 并 将 其 作为 下 一 个 作业 编号 。 让 jobfd 对 于 
作业 文件 保持 打开 状态 ， 因 此 当 作 业 创 建 时 能 够 更 新 作业 编号 。 不 能 关 
闭 该 文件 ， 因 为 这 将 释放 已 经 放置 在 上 面 的 写 锁 。 在 一 个 长 整 型 数 长 度 
为 64 位 的 系统 上 ， 至 少 需 要 一 个 21 字 节 的 缓冲 区 来 存放 代表 最 大 长 整 型 
。 这 里 重用 文件 名 缓冲 区 ， 因 为 在 printh 中 FILENMSZ 定 义 
N64. 

193 /* 

194 * Initialize printer information from configuration file. 

195 * 

196 * LOCKING: none. 

197 */ 

198 void 

199 init_printer(void) 

200 { 

201 printer = get_printaddr(); 

202 if (printer == NULL) 





203 exit(1); /* message already logged */ 
204 printer_name = printer->ai_canonname; 
205 if (printer_name == NULL) 

206 printer_name = "printer"; 

207 log_msg("printer is %s", printer_name); 
208 } 

209 /* 


210 * Update the job ID file with the next job number. 
211 * Doesn’t handle wrap-around of job number. 

212 * 

213 * LOCKING: none. 

214 */ 

215 void 

216 update_jobno(void)217 { 

218 char buf[32]; 

219 if (Iseek(jobfd, 0, SEEK_SET) == -1) 


220 log_sys("can’t seek in job file"); 
221 sprintf(buf, "%d", nextjob); 
222 if (write(jobfd, buf, strlen(buf)) < 0) 


223 log_sys("can’t update job file"); 
224 } 
[193~ 208] init_printer 用 于 设置 打印 机 名 和 地 址 。 调 用 





get_printaddr (KR Autil.c) 获得 打印 机 地 址 。 如 有 果 失 败 ， 记 录 日 志 并 退 
出 。 当 找 不 到 打印 机 地 址 时 ， ”get_printaddr 会 记录 自己 的 错误 信息 日 
志 。 如 果 打 印 机 地 址 未 找到 ， 将 addrinfo 中 的 ai_canonname 设 为 打印 机 
名 。 如 果 该 字段 为 空 ， 将 打印 机 名 设 为 默认 值 。 注 意 ， 将 正在 使 用 的 打 
印 机 名 也 记录 在 日 志 中 ， 以 帮助 管理 员 能 够 诊断 假 脱 机 系统 的 问题 。 

[209 一 224] update_jobno 函 数 用 于 在 作业 文件 varvspoolprinterjobno 
中 写 入 下 一 个 作业 编号 。 首 先 ， 找 到 文件 开头 。 然 后 ， 将 整数 作业 编号 
转换 为 一 个 字符 串 并 写 入 文件 。 如 果 写 入 失败 ， 记 录 日 志 并 退出 。 作 业 
编号 自动 递增 。 如 何 处 理 回 绕 的 作业 编写 留 作 一 个 练习 (见习 题 
21:9) y 

225 /* 

226 * Get the next job number. 

227 * 

228 * LOCKING: acquires and releases joblock. 

229 */ 

230 int32_t 

231 get_newjobno(void) 

232 { 

233 int32_t jobid; 

234 pthread_mutex_lock(&joblock); 

235 jobid = nextjob++; 

236 if (nextjob <= 0) 

237 nextjob = 1; 

238 pthread_mutex_unlock(&joblock); 

239 return(jobid); 

240 } 

241 /* 

242 * Add a new job to the list of pending jobs. Then signal 

243 * the printer thread that a job is pending. 

244 * 

245 * LOCKING: acquires and releases joblock. 











246 */ 

247 void 

248 add_job(struct printreq *reqp, int32_t jobid) 

249 { 

250 struct job *jp; 

251 if (Gp = malloc(sizeof(struct job))) == NULL) 

252 log_sys("malloc failed"); 

253 memcpy(&jp->req, reqp, sizeof(struct printreq)); 

[225~240]  get_newjobno Á H Fí RMP Ss. FO 
joblock 互 斥 量 锁 住 。 递 增 nextjob 变 量 ， 并 处 理 回 绕 的 情况 。 然 后 解锁 互 
斥 量 并 返回 递增 前 的 nextjob 值 。 多 个 线程 可 以 同时 调用 get_newjobno; 
需要 串 行 化 访问 下 一 个 作业 编号 ， 因 此 每 个 线程 得 到 一 个 唯一 的 作业 编 
Fo CWA 11-9， 考 察 在 这 种 情况 下 ， 如 果 不 串 行 化 线程 会 发 生 什么 情 
Wao ) 

[241~253] add_job 函数 用 于 在 挂 起 的 打印 作业 列表 中 增加 一 个 新 
的 作业 请 求 。 首 先 为 ”job 结构 分 配 空间 。 如 果 失 败 ， 记 录 日 志 并 退出 。 
此 时 ， 打 印 请 求 已 经 安全 地 存储 在 磁盘 上 ; 当 打 印 假 脱 机 等 护 进 程 重 局 
时 ， 会 重新 读 取 这 些 请 求 。 当 为 新 作业 分 配 完 空 间 ， 将 客户 端的 请 求 结 
构 复 制 到 作业 结构 。 在 printh 中 一 个 job 结构 包含 一 对 列表 指针 ， 一 个 作 
业 ID 和 一 个 从 客户 端 print 命 令 发 送 过 来 的 printreq 结 构 副 本 。 

254 jp->jobid = jobid; 

255 jp->next = NULL; 

256 pthread_mutex_lock(&joblock); 

257 jp->prev = jobtail; 

258 if (jobtail == NULL) 





259 jobhead = jp; 
260 else 
261 jobtail->next = jp; 


262 jobtail = jp; 

263 pthread_mutex_unlock(&joblock); 

264 pthread_cond_signal(&jobwait); 

265 } 

266 /* 

267 * Replace a job back on the head of the list. 
268 * 

269 * LOCKING: acquires and releases joblock. 
270 */ 


271 void 

272 replace_job(struct job *jp) 

273 { 

274 pthread_mutex_lock(&joblock); 
275 jp->prev = NULL; 

276 jp->next = jobhead; 

277 if Gobhead == NULL) 


278 jobtail = jp; 
279 else 
280 jobhead->prev = jp; 


281 jobhead = jp; 

282 pthread_mutex_unlock(&joblock); 

283 } 

[254~ 265] 保存 作业 ID 并 锁 住 joblock 互 斥 量 以 获得 对 打印 作业 链表 
的 独占 访问 。 将 在 该 链表 尾 增加 新 的 作业 结构 。 将 新 的 作业 结构 的 前 项 
指针 (previous pointer) 指 辣 链 表 中 最 后 一 个 作业 。 如 果 链 表 为 空 ， 将 
jobhead 指 向 新 的 结构 。 否 则 ， 将 链表 中 最 后 一 项 的 后 项 指针 (next 
pointer) 指向 新 的 结构 。 然 后 设置 jobtail 指 向 新 的 结构 。 对 互 斥 量 解 
锁 ， 然 后 给 打印 机 线程 发 信号 ， 告 诉 该 线程 另 一 个 作业 可 用 了 。 

[266 一 283] 函数 replace_job 用 于 将 作业 插入 到 挂 起 作业 队列 头 部 。 
需要 获得 joblock 互 斥 量 ， 将 job 结构 中 的 前 项 指针 设 为 NULL， 将 后 项 指 
针 指 向 表 头 。 如 果 表 为 空 ， 将 jobtail 指 向 插入 的 job 结构 。 和 否则 ， 将 表 中 
第 一 个 作业 结构 的 前 项 指针 指 问 插入 的 job 结 构 。 然 后 将 jobhead 指 问 插 
入 的 job 结构 ， 成 为 新 的 表 头 。 最 后 ， 释 放 joblock 互 斥 量 。 














284 /* 

285 * Remove a job from the list of pending jobs. 
286 * 

287 * LOCKING: caller must hold joblock. 

288 */ 

289 void 

290 remove_job(struct job *target) 

291 { 

292 if (target->next != NULL) 

293 target->next->prev = target->prev; 
294 else 

295 jobtail = target->prev; 


296 if (target->prev != NULL) 


297 target->prev->next = target->next; 


298 else 

299 jobhead = target->next; 

300 } 

301 /* 

302 * Check the spool directory for pending jobs on start-up. 

303 * 

304 * LOCKING: none. 

305 */ 

306 void 

307 build_gonstart(void) 

308 { 

309 int fd, err, nr; 

310 int32 t jobid; 

311 DIR *dirp; 

312 struct dirent *entp; 

313 struct printreq req; 

314 char dname|FILENMSZ], 
fname[FILENMSZ]; 


315 sprintf(dname, "%s/%s", SPOOLDIR, REQDIR); 

316 if ((dirp = opendir(dname)) == NULL) 

317 return; 

[284~300] remove_job 将 给 定 的 作业 从 挂 起 的 作业 列表 中 删除 。 调 
用 者 必须 已 经 持 有 joblock ” 互 斥 量 。 如 果 后 项 指针 不 为 空 ， 将 下 一 个 条 
目的 前 项 指针 指向 被 删除 目标 的 前 项 指针 所 指向 的 条 有 日。 否则 ， 该 条 日 
为 列表 中 最 后 一 个 ， 因 此 将 jobtail 指 疝 被 删除 目标 的 前 项 指针 所 指 回 的 
和 条目。 如 果 被 删除 目标 的 前 项 指针 不 为 空 ， 将 前 一 个 条 目的 后 项 指针 指 
问 被 删除 目标 的 后 项 指针 所 指 同 的 条 目 。 人 否则 ， 这 个 是 表 中 第 一 个 条 
目 ， 因 此 将 jobhead 指 回 被 删除 目标 后 面 的 那个 条 目 。 

[301~317] 当 守 护 进程 启动 时 ， 调 用 build_qonstart 从 存储 
在 /var/spool/printer/reqs 中 的 磁盘 文件 建立 一 个 内 存 中 的 打印 作业 列表 。 
如 采 不 能 打开 该 目录 ， 表 示 没 有 打印 作业 要 处 理 ， 因 此 就 返回 

318 while ((entp = readdir(dirp)) != NULL) { 








319 ye 
320 * Skip "." and ".." 
321 */ 


322 if (strcmp(entp->d_name, ".") == 0 || 


323 
324 
325 
326 
327 
328 
>d_name); 
329 
330 
331 
332 
333 
334 
335 
336 
337 
338 
339 
340 
341 
DATADIR, 
342 
343 
344 
345 
346 
347 
348 
349 
350 
351 } 


strcmp(entp->d_name, "..") == 0) 
continue; 
/* 
* Read the request structure. 
mf 
sprintf(fname, "%s/%s/%s", SPOOLDIR, REQDIR, entp- 


if (fd = open(fname, O_RDONLY)) < 0) 
continue; 
nr = read(fd, &req, sizeof(struct printreq)); 
if (nr != sizeof(struct printreq)) { 
if (nr < 0) 
err = errno; 
else 
err = EIO; 
close(fd); 
log_msg("build_gonstart: can’t read %s: %s", 
fname, strerror(err)); 
unlink(fname); 
sprintf(fname, "%s/%s/%s", SPOOLDIR, 


entp->d_name); 
unlink(fname); 
continue; 
} 
jobid = atol(entp->d_name); 
log_msg("adding job %d to queue", jobid); 
add_job(&regq, jobid); 
i 
closedir(dirp); 





[318~324] 在 目录 中 一 次 读 取 一 个 条 目 ， 忽 略 . 和 ..。 

[325 一 345] 对 于 每 个 条 目 ， 创 建 一 个 文件 完全 路 径 名 并 只 读 打开 。 
如 果 open 调 用 失败 ， 跳 过 该 文件 。 人 否则 ， 将 读 取保 存在 文件 中 的 printreq 
结构 。 如 果 不 能 读 取 整个 结构 ， 关 闭 该 文件 ， 记 录 日 志 并 unlink 该 文 
件 。 然 后 建立 相应 数据 文件 的 完全 路 径 名 ， 再 unlink 访 文件。 

[346 一 351] 如 果 能 够 读 取 一 个 完整 的 printreq 结 构 ， 将 文件 名 转换 为 








作业 ID 《文件 名 就 是 其 作业 ID) ， 记 录 日 志 ， 然 后 将 请 求 加 入 到 挂 起 的 
打印 作业 列表 。 当 读 完 整个 目录 ， readdir 返 回 NULL， 关 闭 目录 然后 返 


回 。 


352 
353 
354 
355 
356 
357 
358 
359 
360 
361 
362 
363 
364 
365 
366 
367 
368 
369 
370 
371 
372 
373 
374 
375 
376 
377 
378 
379 
380 
381 
382 
383 
384 


/* 


* Accept a print job from a client. 
kK 

* LOCKING: none. 

a 


void * 
client_thread(void *arg) 


{ 


int n, fd, sockfd, nr, nw, first; 
int32_t jobid; 

pthread_t tid; 

struct printreq req; 

struct printresp res; 

char name|FILENMSZ]; 

char buf[IOBUFSZ]; 


tid = pthread_self(); 
pthread_cleanup_push(client_cleanup, (void *)((long)tid)); 
sockfd = (long)arg; 
add_worker(tid, sockfd); 
/* 
* Read the request header. 
*/ 
if ((n = treadn(sockfd, &req, sizeof(struct printreq), 10)) != 
sizeof(struct printreq)) { 
res.jobid = 0; 
if (n < 0) 
res.retcode = htonl(errno); 
else 
res.retcode = htonl(EIO); 
stmcpy(res.msg, strerror(res.retcode), MSGLEN_MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
pthread_exit((void *)1); 


} 
[352~370] 当 连 接 请 求 被 接受 时 ，main 中 派生 出 client thread。 其 


作用 是 从 客户 问 print 命 令 中 接收 要 打印 的 文件 。 为 每 个 客户 端 打 印 请 求 
分 别 创 建 一 个 独立 的 线程 。 

首先 是 安装 线程 清理 处 理 程序 〈 见 11.5 节 中 线程 清理 处 理 程序 的 讨 
wW) 。 清 理 处 理 程序 是 client_cleanup， 将 在 后 面 用 到 。 它 仅 带 一 个 参 
数 : 线程 ID。 然 后 调用 add_worker 来 创建 一 个 worker_thread 结 构 并 将 其 
加 入 到 活跃 的 客户 端 线程 列表 中 。 

[371~384] 此 时 ， 完 成 了 线程 的 初始 化 任务 ， 因 此 从 客户 端 读 取 请 
求 头 。 如 果 客 户 端 发 送 的 数据 少 于 期 望 或 遇 到 错误 ， 则 啊 应 一 个 消息 ， 
该 消息 指出 错误 的 原因 ， 然 后 调用 pthread_exit 结 束 线程 。 

385 req.size = ntohl(req.size); 

386 req.flags = ntohl(req.flags); 








387 /* 
388 * Create the data file. 
389 */ 


390 jobid = get_newjobno(); 

391 sprintf(name, "%s/%s/%ld", SPOOLDIR, DATADIR, jobid); 
392 fd = creat(name, FILEPERM); 

393 if (fd < 0) { 


394 res.jobid = 0; 

395 res.retcode = htonl(errno); 

396 log_msg("client_thread: can't create %s: %s", name, 
397 strerror(res.retcode)); 

398 stmcpy(res.msg, strerror(res.retcode), MSGLEN_MAX); 
399 writen(sockfd, &res, sizeof(struct printresp)); 

400 pthread_exit((void *)1); 

401 } 

402 /* 

403 * Read the file and store it in the spool directory. 

404 * Try to figure out if the file is a PostScript file 

405 * or a plain text file. 

406 */ 


407 first = 1; 
408 while ((nr = tread(sockfd, buf, IOBUFSZ, 20)) > 0) { 


409 if (first) { 
410 first = 0; 
411 if (strncmp(buf, "%!PS", 4) != 0) 


412 req.flags |= PR_TEXT; 


413 } 

[385~401] 将 请 求 头 中 的 整数 字段 转换 成 主机 字 节 序 ， 调 用 
get_newjobno 来 保存 这 个 打印 请 求 的 下 一 个 作业 编写。 建立 作业 数据 文 
件 ， 名 为 /var/spool/printer/data/jobid，jobid 是 请 求 的 作业 ID。 采 用 权限 
许可 来 防止 其 他 人 读 取 这 些 文件 (print.h 中 定义 FILEPERM 为 
S_IRUSRIS_IWUSR) 。 如 果 不 能 创建 该 文件 ， 记 录 错 误 日 志 ， 发 送 失 
败 啊 应 给 客户 端 ， 调 用 pthread_exit 结 束 线 程 。 

[402~413] 读 取 来 自 客 户 端的 文件 内 容 ， 要 将 其 写 入 数据 文件 的 私 
有 副本 中 。 但 是 在 写 任 何 东 西 之 前 ， 需 要 在 第 一 次 循环 时 检查 一 下 是 人 否 
是 PostScript 文 件 。 如 果 该 文件 不 是 以 %!PS 模 式 开 头 ， 可 以 假定 为 其 为 
纯 文 本 文件 ， 这 种 情况 下 在 请 求 头 中 设置 PR_TEXT 标 志 。 如果 在 print 
命令 中 有 -t 标 志 ， 那 么 客户 端 也 会 设置 此 标志 。) 尽管 PostScript 程 序 不 
要 求 以 模式 %!PS 开 始 ， 但 文档 格式 指南 (Adobe Systems [1999]) 强烈 
推荐 这 种 方式 。 

















414 nw = write(fd, buf, nr); 

415 if (nw != nr) { 

416 res.jobid = 0; 

417 if (nw < 0) 

418 res.retcode = htonl(errno); 

419 else 

420 res.retcode = htonl(EIO); 

421 log_msg("client_thread: can’t write %s: %s", name, 

422 strerror(res.retcode)); 

423 close(fd); 

424 strncpy(res.msg, strerror(res.retcode), 
MSGLEN_MAX); 

425 writen(sockfd, &res, sizeof(struct printresp)); 

426 unlink(name); 

427 pthread_exit((void *)1); 

428 } 

429 } 

430 close(fd); 

431 /* 

432 * Create the control file. Then write the 

433 * print request information to the control 

434 * file. 


435 */ 


436 
437 
438 
439 
440 
441 
442 
443 
444 
445 
jobid); 
446 
447 
448 


sprintf(name, "%s/%s/%d", SPOOLDIR, REQDIR, jobid); 
fd = creat(name, FILEPERM); 
if (fd < 0) { 


} 


res.jobid = 0; 

res.retcode = htonl(errno); 

log_msg("client_thread: can’t create %s: %s", name, 
strerror(res.retcode)); 

stmcpy(res.msg, strerror(res.retcode), MSGLEN_MAX); 

writen(sockfd, &res, sizeof(struct printresp)); 
sprintf(name, "%s/%s/%d", SPOOLDIR, DATADIR, 


unlink(name); 
pthread_exit((void *)1); 


Aa 前 的 数据 写 入 到 数据 文件 。 如 果 write 失 


败 ， 记录 错误 I 天 


日 志 ， 关 闭 数据 文件 的 文件 描述 符 ， 发 送出 错 消 轧 给 客户 





端 ， Po 调用 “pthread_exit 退 出 。 注 意 ， 不 需要 显 式 关闭 套 


。 当 调用 pthread_exit 时 ， 线 程 清理 处 理 程序 会 处 理 这 些 





_ 当 接收 到 所 有 要 打印 的 数据 ， 关 闭 数据 文件 的 文件 描述 符 
[431~448] 接 下 来 ， 创 建文 件 /var/spool/printer/reqs/jobid 以 记 住 打印 


请 求 。 如 果 失 败 ， 
件 ， 终 止 线程 。 


449 
450 
451 
452 
453 
454 
455 
456 
457 
458 
459 
460 
461 
462 


记录 错误 日 志 ， 发 送出 错 啊 应 给 客户 端 ， 删 除数 据 文 


nw = write(fd, &req, sizeof(struct printreq)); 
if (nw != sizeof(struct printreq)) { 


res.jobid = 0; 
if (nw < 0) 
res.retcode = htonl(errno); 
else 
res.retcode = htonl(EIO); 
log_msg("client_thread: can’t write %s: %s", name, 
strerror(res.retcode)); 
close(fd); 
stmcpy(res.msg, strerror(res.retcode), MSGLEN_MAX); 
writen(sockfd, &res, sizeof(struct printresp)); 
unlink(name); 
sprintf(name, "%s/%s/%d", SPOOLDIR, DATADIR, 


jobid); 


463 unlink(name); 

464 pthread_exit((void *)1); 
465 } 

466 close(fd); 

467 he 

468 * Send response to client. 
469 w 


470 res.retcode = 0; 
471 res.jobid = htonl(jobid); 
472 sprintf(res.msg, "request ID %d", jobid); 


473 writen(sockfd, &res, sizeof(struct printresp)); 
474 pe 

475 * Notify the printer thread, clean up, and exit. 
476 a 


477 log_msg("adding job %d to queue", jobid); 

478 add_job(&regq, jobid); 

479 pthread_cleanup_pop(1); 

480 return((void *)0); 

481 } 

[449~ 465] 将 printreq 结 构 写 入 控制 文件 。 如 果 出 错 ， 则 记录 日 志 ， 
ere renee Ue er eae 
人 ERNE o 

[466~473] KAFE HAFI FRIT HRR 2S Pi, 1 
消息 包括 作业 ID 和 成 功 状 态 〈retcode 设 为 0) 。 

[474 一 481] 调用 add_job 将 接收 的 文件 加 入 到 挂 起 作业 列表 中 ， 调 用 
pthread_cleanup_pop 完 成 清理 过 程 。 当 返回 时 线程 终止 。 注 意 ， 线 程 退 
出 之 前 ， 必 须 关 闭 不 再 使 用 的 任何 文件 描述 符 。 与 线程 终止 不 同 ， 当 一 
个 线程 退出 并 且 进 程 中 仍 有 其 他 线程 时 ， 文 件 描 述 符 不 会 自动 关闭 。 如 
末 不 关闭 不 需要 的 文件 描述 符 ， 终 将 耗 尽 资源 。 








482 /* 
483 * Add a worker to the list of worker threads. 
484 * 


485 * LOCKING: acquires and releases workerlock. 
486 */ 

487 void 

488 add_worker(pthread_t tid, int sockfd) 


489 { 


490 struct worker_thread *wtp; 

491 if ((wtp = malloc(sizeof(struct worker_thread))) == NULL) { 
492 log_ret("add_worker: can't malloc"); 
493 pthread_exit((void *)1); 

494 } 

495 wtp->tid = tid; 

496 wtp->sockfd = sockfd; 

497 pthread_mutex_lock(&workerlock); 

498 wtp->prev = NULL; 

599 wtp->next = workers; 

500 if (workers != NULL) 

501 workers ->prev = wtp; 

503 workers = wtp; 

504 pthread_mutex_unlock(&workerlock); 

502 

505 } 

506 /* 

507 * Cancel (kill) all outstanding workers. 

508 Bi 

509 * LOCKING: acquires and releases workerlock. 
510 */ 

511 void 

512 kill_workers(void) 

513 { 

514 struct worker_thread *wtp; 

515 pthread_mutex_lock(&workerlock); 

516 for (wtp = workers; wtp != NULL; wtp = wtp->next) 
517 pthread_cancel(wtp->tid); 

518 pthread_mutex_unlock(&workerlock); 

519 } 


[482~505] add_worker 将 一 个 worker_thread 结构 加 入 活动 线程 列 
表 中 。 分 配 该 结构 需要 的 内 存 ， 初 始 化 它 ， 锁 住 workerlock ERE, 44 
结构 加 入 到 列表 的 头 部 ， 然 后 解锁 互 斥 量 。 

[506~519] kill_workers 了 水 数 裔 历 工 作者 线程 列表 ,然后 一 一 市 除 。 
遍历 列表 时 持 有 workerlock 互 斥 量 。 注 意 ，pthread_cancel 仪 仅 将 线程 列 
入 删除 计划 ， 实 际 的 删除 动作 在 每 个 线程 到 达 下 一 个 删除 点 时 发 生 。 








520 /* 


521 * Cancellation routine for the worker thread. 
522 X 

523 * LOCKING: acquires and releases workerlock. 
524 */ 

525 void 

526 client_cleanup(void *arg) 

527 { 

528 struct worker_thread *wtp; 

529 pthread_t tid; 

530 tid = (pthread_t)((long)arg); 

531 pthread_mutex_lock(&workerlock); 

532 for (wtp = workers; wtp != NULL; wtp = wtp->next) { 
533 if (wtp->tid == tid) { 

534 if (wtp->next != NULL) 

935 wtp->next->prev = wtp->prev; 
536 if (wtp->prev != NULL) 

937 wtp->prev->next = wtp->next; 
538 else 

539 workers = wtp->next; 

540 break; 

541 } 

542 } 

543 pthread_mutex_unlock(&workerlock); 

544 if (wtp != NULL) { 

545 close(wtp->sockfd); 

546 free(wtp); 

547 } 

548 } 


[520~542] 函数 dlient_cleanup 是 与 客户 问 命 令 通 信 的 工作 者 线程 的 
线程 清理 程序 。 当 线程 调用 pthread_exit 时 ， 或 者 用 一 个 非 0 参数 调用 
pthread_cleanup_pop， 或 者 啊 应 一 个 删除 请 求 时 ，client_cleanup 函数 会 
被 调用 。 其 参数 是 终止 线程 的 线程 ID。 

锁 住 workerlock 互 斥 量 然后 搜索 工作 者 线程 列表 ， 直 到 找到 一 个 匹 
当 找 到 一 个 匹配 时 ， 从 列表 中 删除 工作 者 线程 结构 并 且 停 

[543 一 548] 解锁 workerlock 互 斥 量 ， 关 闭 线程 用 于 和 客户 端 通信 的 











套 接 字 文 件 描述 符 ， 然 后 释放 worker thread 结构 的 内 存 。 

既然 要 获得 workerlock 互 斥 量 ， 当 kill_workers 函 数 正在 遍历 列表 
时 ， 如 果 一 个 线程 到 达 一 个 删除 点 时 ， 必 须 等 待 直到 kill_workers 释 放 互 
斥 量 时 才 可 以 继续 处 理 。 


549 /* 
550 * Deal with signals. 
551 x 


552 * LOCKING: acquires and releases configlock. 
553 i 


554 void* 

555 signal_ thread(void *arg) 

556 { 

557 int err, Signo; 

558 for (;;) { 

559 err = sigwait(&mask, &signo); 

560 if (err != 0) 

561 log_quit("sigwait failed: %s", strerror(err)); 

562 switch (signo) { 

963 case SIGHUP: 

564 hs 

565 * Schedule to re-read the configuration file. 

566 +7 

567 pthread_mutex_lock(&configlock); 

568 reread = 1; 

569 pthread_mutex_unlock(&configlock); 

570 break; 

571 case SIGTERM: 

572 kill_workers(); 

573 log_msg("terminate with signal %s", 
strsignal(signo)); 

574 exit(0); 

575 default: 

576 kill_workers(); 

577 log_quit("unexpected signal %d", signo); 

578 } 

579 } 


580 } 


[549~562] ”函数 signal_thread 由 负责 处 理 信 号 的 线程 运行 。 在 main 
函数 中 初始 化 信号 掩 码 ， 该 掩 码 包括 SIGHUP “和 SIGTERM。 这 里 ， 调 
用 sigwait 来 等 竺 这些 信号 中 的 一 个 出 现 。 如 果 sigwait 失 败 ， 记 录 出 错 日 

[563~570] “如果 接收 到 SIGHUP， 然 后 获得 configlock 互 斥 量 ， 将 
reread 变 量 设 为 1， 释 放 互 斥 量 。 这 就 告诉 打印 机 守护 进程 在 其 处 理 循环 
的 下 一 次 友 代 时 再 次 读 取 配置 文件 。[571 一 574] 如 果 接 收 到 
SIGTERM， 调 用 kill_workers 来 杀 死 所 有 的 工作 者 线程 ， 记 录 日 志 ， 然 
后 调用 exit 终 止 进程 。 

[575~580] ”如 果 接 收 到 非 期 望 的 信号 ， 则 杀 死 工作 者 线程 并 调用 
log_quit 来 记录 日 志 然 后 退出 。 

581 /* 

582 * Add an option to the IPP header. 

583 * 

584 * LOCKING: none. 

585 */ 

586 char * 

587 add_option(char *cp, int tag, char *optname, char *optval) 

588 { 

589 int n; 

590 union { 

591 int16_t s; 

592 char c[2]; 

593 } u; 

594 *cp++ = tag; 

595 n = strlen(optname); 

596 u.s = htons(n); 

597 *cp++ = u.c[0]; 

598 *cp++ = u.c[1]; 

699 strcpy(cp, optname); 

600 cp += n; 

601 n = strlen(optval); 

602 u.s = htons(n); 

603 *cp++ = u.c[0]; 

604 *cp++ = u.c[1]; 

605 strcpy(cp, optval); 

606 return(cp + n); 


607 } 

[581~593] 函数 add_option 用 于 在 送 到 打印 机 的 IPP 首 部 中 添加 一 个 
选项 ， 回 忆 图 21-4， 属 性 的 格式 是 1 字 节 的 描述 属性 类 型 的 标志 ， 然 后 
是 以 2 字 节 的 二 进 制 整 数 形式 存储 的 属性 名 字 的 长 度 ， 接 着 是 名 字 ， 属 
PEEPS EE, pele re Jee PEAS 

PPRA fT AER TK ALE E EB AY — E A SZ N. Ah 
理 露 架构， 例如 SPARC， 并 不 能 从 任意 地 址 装 入 一 个 整数 。 这 意味 着 不 
能 通过 如 下 方式 在 IPP 首部 存放 一 个 整数 : 该 方式 将 一 个 指针 转换 成 
int16 t 指向 在 首部 存放 整数 的 地 址 。 相 反 ， 需 要 一 次 复制 1 字 节 整数 。 
这 就 是 为 什么 我 们 定义 一 个 包含 16 位 整数 和 2 字 市 数组 的 union。 

[594 一 607] ”在 首部 存储 标志 并 将 属性 名 字 的 长 度 转 换 为 网 络 字 市 
序 。 一 次 复制 1 个 字 节 到 首部 。 接 着 复制 属性 名 字 。 重 复 这 个 过 程 ， 继 
续 复制 属性 值 ， 并 返回 首部 中 下 一 个 应 该 开始 的 部 分 的 地 址 。 

608 /* 

609 * Single thread to communicate with the printer. 























610 * 

611 * LOCKING: acquires and releases joblock and configlock. 
612 */ 

613 void * 

614 printer_thread(void *arg) 

615 { 

616 struct job *jp; 

617 int hlen, ilen, sockfd, fd, nr, nw, extra; 
618 char *icp, *hcp, *p; 

619 struct ipp_hdr *hp; 

620 struct stat sbuf; 

621 struct iovec iov[2]; 

622 char name|[FILENMSZ]; 
623 char hbuf[HBUFSZ]; 

624 char ibuf[IBUFSZ]; 

625 char buf[IOBUFSZ]; 

626 char str[ 64]; 

627 struct timespec ts = { 60,0}; /* 1 minute */ 
628 for (;;) { 

629 ym 

630 * Get a job to print. 


631 */ 


632 pthread_mutex_lock(&joblock); 
633 while (jobhead == NULL) { 


634 log_msg("printer_thread: waiting..."); 
635 pthread_cond_wait(&jobwait, &joblock); 
636 } 


637 remove_job(jp = jobhead); 

638 log_msg("printer_thread: picked up job %d", jp->jobid); 

639 pthread_mutex_unlock(&joblock); 

640 update_jobno(); 

[608~627] PA 2printer_thread h 5 P2847 EWLOE RTEZ íT. (Ë 
用 icp 和 ibuf 来 建立 IPP 首 部 。 使 用 hcp 和 hbuf 建 六 HTTP 首 部 。 需 要 在 独立 
的 缓冲 区 中 建立 首部 。HTTP 首 部 包括 ASCII 表 示 的 长 度 字段 ， 而 且 在 拼 
装 出 IPP 首 部 之 前 ， 并 不 知道 应 该 预 留 多 大 的 空间 。 在 一 次 调用 中 使 用 
writev 来 与 这 两 个 头 。 

[628 一 640] 打印 机 线程 在 一 个 等 待 将 作业 传送 到 打印 机 的 无 限 循 环 
中 运行 。 使 用 “joblock 互 斥 量 来 保护 作业 列表 。 如 果 作 业 没 有 挂 起 ， 使 
用 pthread_cond_wait 来 等 待 到 来 的 作业 。 当 一 个 作业 准备 好 时 ， 调 用 
remove_job 将 其 从 列表 中 删除 。 

此 时 仍 持 有 互 斥 量 ， 因 此 释放 互 斥 量 并 调用 update_jobno 将 下 一 个 
作业 号 编写 入 到 /var/spool/printer/jobno。 














641 ce 

642 * Check for a change in the config file. 
643 */ 

644 pthread_mutex_lock(&configlock); 

645 if (reread) { 

646 freeaddrinfo(printer); 

647 printer = NULL; 

648 printer _name = NULL; 

649 reread = 0; 

650 pthread_mutex_unlock(&configlock); 
651 init_printer(); 

652 } else { 

653 pthread_mutex_unlock(&configlock); 
654 } 

655 {? 

656 * Send job to printer. 


657 */ 


658 
>jobid); 
659 
660 
661 
662 
663 
664 
665 
666 
667 
668 
669 
670 
671 


sprintf(name, "%s/%s/%ld", SPOOLDIR, DATADIR, jp- 


if ((fd = open(name, O_RDONLY)) < 0) { 
log_msg("job %ld canceled - can't open %s: %s", 
jp->jobid, name, strerror(errno)); 


free(jp); 
continue; 


} 
if (fstat(fd, &sbuf) < 0) { 
log_msg("job %ld canceled - can't fstat %s: %s", 
jp->jobid, name, strerror(errno)); 
free(jp); 
close(fd); 
continue; 


(edi ~654) 现在 有 了 要 打印 的 作业 ， 检查 一 下 配置 文件 有 无 改变 。 
锁 住 configlock 互 厅 量 并 答 但 reread 变 量 。 如 果 该 值 非 0， 那 么 释放 旧 的 
admini l e 清空 指针 ， 解 锁 互 斥 量 ， 然 后 调用 init_printer 来 重新 初始 


化 指针 信息 





既然 从 main 线 程 初始 化 后 只 4 有 这 个 上 下 文 可 以 查看 并 可 能 








更 改 打印 机 信息 息 ， 因 此 除了 使 用 configlock 互 斥 量 来 保护 reread 标 志 :的 状 
态 外 ， 不 需 pa 他 的 同步 手段 。 


注意 ， 





管 在 此 函数 中 获得 和 释放 两 个 不 同 互 扩 量 ， 但 是 并 没有 同 





E a ee 


[655~671] 
构 ， 然 后 继续 


如 果 不 能 打开 数据 文件 ， 则 记录 出 错 日 志 ， 释 放 job 结 


打开 文件 之 后 ， 调用 fstat 来 找到 文件 的 大 小 如 果 失 


败 ， 记 录 出 错 日 志 并 清理 ， 然 后 继续 。 


672 
0, 

673 

674 
%s", 

675 

676 

677 

678 

679 

680 


if ((sockfd = connect_retry(AF_INET, SOCK_STREAM, 


printer->ai_addr, printer->ai_addrlen)) < 0) { 
log_msg("job %d deferred - can’t contact printer: 


jp->jobid, strerror(errno)); 


goto defer; 
} 
/* 
* Set up the IPP header. 
*/ 


681 icp = ibuf; 


682 hp = (struct ipp_hdr *)icp; 

683 hp->major_version = 1; 

684 hp->minor_version = 1; 

685 hp->operation = htons(OP_PRINT_JOB); 

686 hp->request_id = htonl(jp->jobid); 

687 icp += offsetof(struct ipp_hdr, attr_group); 

688 *icp++ = TAG_OPERATION_ATTR; 

689 icp = add_option(icp, TAG_CHARSET, "attributes- 
charset", 

690 "utf-8"); 

691 icp = add_option(icp, TAG_NATULANG, 

692 "attributes-natural-language", "en-us"); 

693 sprintf(str, "http://%s/ipp", printer_name); 

694 icp = add_option(icp, TAG_URI, "printer-uri", str); 

695 icp = add_option(icp, TAG_NAMEWOLANG, 

696 "requesting-user-name", jp->req.usernm); 

697 icp = add_option(icp, TAG_NAMEWOLANG, "job- 
name", 

698 jp->req.jobnm); 





[672~677] 打开 一 个 连接 到 打印 机 的 流 套 接 字 。 如 果 connect_retry 
调用 失败 ， 跳 到 defer 处 ， 在 这 里 清理 、 延 迟 一 段 时 间 ， 然 后 再 答 试 。 

[678~698] 接 下 来 ， 建 立 IPP 首 部 。 其 操作 是 打印 作业 (print-job) 
请 求 。 使 用 htons 将 2 字 节 的 操作 了 从 主机 转换 为 网 络 字 节 序 ， 使 用 htonl 
将 4 字 节 的 作业 ID 从 主机 转换 为 网 络 字 节 序 。 完 成 首部 的 初始 化 之 后 ， 
设置 标志 值 来 指示 其 后 跟随 操作 属性 。 

调用 add_option 将 属性 添加 到 报 文中 。 图 12-5 列 出 了 打印 作业 请 求 
所 需 的 操作 属性 ， 前 3 个 是 必需 的 。 将 字符 集 设 为 UTF-8， 该 字符 集 是 
打印 机 必须 支持 的 ;指定 语言 为 en-us， 即 代表 美国 吴语 (U.S. 
English) ;另外 一 个 必需 的 属性 是 URI CUniform Resource 
Identifier) ， 将 其 设 为 http:/printer_name/ipp。 

推荐 使 用 requesting-user-name 属 性 ， 但 不 是 必需 的 。job-name 属 性 
也 是 可 选 的 。print 命 令 将 要 打印 的 文件 名 作为 作业 名 发 送 ， 该 名 字 能 够 
帮助 用 户 区 别 多 个 要 处 理 的 作业 。 

699 if (jp->req.flags & PR_TEXT) { 

700 p = "text/plain"; 

701 extra = 1; 








702 } else { 


703 p = "application/postscript"; 

704 extra = 0; 

705 } 

706 icp = add_option(icp, TAG_MIMETYPE, "document- 
format", p); 

707 *icp++ = TAG_END_OF_ATTR; 

708 ilen = icp - ibuf; 

709 i= 

710 * Set up the HTTP header. 

711 sa 

712 hcp = hbuf; 

713 sprintf(hcp, "POST /ipp HTTP/1.1\r\n"); 

714 hcp += strlen(hcp); 

715 sprintf(hcp, "Content-Length: %ld\r\n", 

716 (long)sbuf.st_size + ilen + extra); 

717 hcp += strlen(hcp); 

718 strcpy(hcp, "Content-Type: application/ipp\r\n"); 

719 hcp += strlen(hcp); 

720 sprintf(hcp, "Host: %s:%d\r\n", printer_name, 
IPP_PORT); 

721 hcp += strlen(hcp); 

722 *hcp++ = ’\r’; 

723 *hcp++ = ’\n’; 

724 hlen = hcp - hbuf; 


[699~708] 提供 的 最 后 一 个 属性 是 document-format。 如 果 省 略 该 属 
性 ， 则 假定 文件 格式 是 打印 机 默认 格式 。 对 于 PostScript 打 印 机 ， 格 式 可 
能 是 PostScript， 但 是 一 些 打印 机 可 以 自动 检测 格式 并 在 PostScript 与 纯 
文本 或 PCL CHP 的 打印 机 命令 语言 ) 格式 间 做 选择 。 如 果 PR_TEXT 标 
志 被 设置 ， 则 将 文档 格式 设置 为 textplain。 人 否则 ， 设 置 为 
application/postscript。 然 后 在 属性 结束 处 用 结束 属性 标志 定 界 并 计算 IPP 
首部 的 大 小 。 

整数 extra 用 来 记录 任何 可 能 需要 传输 到 打印 机 的 附加 字符 。 稍 后 会 
看 到 ， 需 要 发 送 一 个 附加 字符 以 能 够 可 靠 地 打印 纯 文本 。 当 要 计算 内 容 
长 度 时 ， 需 要 考虑 这 个 附加 字符 。 

[709 一 724] ”现在 知道 了 IPP 首 部 的 大 小 ， 可 以 建 六 HTTP 首 部 。 将 
Context-Length 设 为 IPP 首 部 的 字 节 长 度 加 上 要 打印 文件 的 大 小 再 加 上 需 





要 发 送 的 附加 字符 的 长 度 。 
Content-Type 为 application/ipp。 用 回 车 换行 符 结 束 HTTP 首 部 。 最 
后 ， 计 算 HTTP 首 部 的 大 小 。 


725 fs 

726 * Write the headers first. Then send the file. 

727 */ 

728 iov[0].iov_base = hbuf; 

729 iov[0].iov_len = hlen; 

730 iov[1].iov_base = ibuf; 

731 iov[1].iov_len = ilen; 

732 if (writev(sockfd, iov, 2) != hlen + ilen) { 

733 log_ret("can’t write to printer"); 

734 goto defer; 

735 } 

736 if (jp->req.flags & PR_TEXT) { 

737 /* 

738 * Hack: allow PostScript to be printed as plain text. 

739 my 

740 if (write(sockfd, "\b", 1) != 1) { 

741 log_ret("can’t write to printer"); 

742 goto defer; 

743 } 

744 } 

745 while ((nr = read(fd, buf, IOBUFSZ)) > 0) { 

746 if ((nw = writen(sockfd, buf, nr)) != nr) { 

747 if (nw < 0) 

748 log_ret("can’t write to printer"); 

749 else 

750 log_msg("short write (%d/%d) to printer", 
nw, nr); 

751 goto defer; 

752 } 

753 


} 
[725~735] 将 iovec 数 组 的 第 一 个 元 素 指 加 HITP 首 部 ， 第 二 个 元 素 
指 癌 IPP 首 部 。 然 后 采用 writev 将 两 个 首部 送 往 打 印 机 。 如 果 写 失败 或 者 
写 入 少 于 请 求 的 字 节 数 ， 则 记录 日 志 并 跳 转 到 defer， 在 这 里 清理 并 延迟 
一 段 时 间 ， 然 后 再 次 尝试 。 


[736~ 744] 即使 指明 了 纯 文 本 ，Phaser 8560 还 是 会 自动 检测 文档 格 
式 。 为 了 防止 它 识别 出 要 以 纯 文 本 格式 打印 的 文件 的 开头 ， 将 退 格 作为 
第 一 个 及 送 字符 ， 这 个 字符 不 会 被 打印 出 来 ， 并 且 能 够 使 自动 识别 文件 
aoe wt AY LAFI El PostScript XAF AS FB FT ER PostScript X 

和 镜像 。 

[745~753] 通过 IOBUFSZ 块 将 数据 文件 发 往 打 印 机 。 当 套 接 字 绥 剖 
区 满 的 时 候 ， write 的 发 送 少 于 请 求 ， 因此 可 以 用 write 处 理 这 种 情况 。 当 
不 必 担 心 这 种 情况 ， 因 为 它们 都 很 小 ， 但 要 打印 的 文件 却 是 
很 大 的 。 


754 if (nr < 0) { 

755 log_ret("can’t read %s", name); 

756 goto defer; 

757 } 

758 /* 

759 * Read the response from the printer. 

760 */ 

761 if (printer_status(sockfd, jp)) { 

762 unlink(name); 

763 sprintf(name, "%s/%s/%d", SPOOLDIR, REQDIR, 
jp->jobid); 

764 unlink(name); 

765 free(jp); 

766 jp = NULL; 

767 

768 defer: 

769 close(fd); 

770 if (sockfd >= 0) 

771 close(sockfd); 

772 if (jp != NULL) { 

773 replace_job(jp); 

774 nanosleep(&ts, NULL); 

775 } 

776 } 

777 } 

778 /* 


779 * Read data from the printer, possibly increasing the buffer. 
780 * Returns offset of end of data in buffer or -1 on failure. 


781 * 

782 * LOCKING: none. 

783 */ 

784 ssize_t 

785 readmore(int sockfd, char **bpp, int off, int *bszp) 

[754~757] 读 到 文件 末尾 时 ，read 返 回 0。 如 果 读 失败 ， 记 录 错 误 信 
息 日 志 并 跳 至 defer。[758 一 767] 将 文件 发 送 给 打印 机 后 ， 调 用 
printer_status 来 读 取 打 印 机 对 于 请 求 的 啊 应 。 

如 果 成 功 ，printer_status 返 回 一 个 非 0 值 ， 束 可 以 删除 数据 文件 和 控 
制 文件 。 然 后 释放 job 结 构 ， 将 其 指针 设 为 NULL， 然 后 到 达 defer 标 签 。 

[768~777] 在 defer 标 签 处 ， 关 闭 打开 的 数据 文件 描述 符 。 如 果 套 接 
字 描 述 符 是 有 效 的 ， 也 将 其 关闭 。 如 出 错 ，jp 指向 要 打印 作业 的 作业 结 
构 ， 这 样 就 可 以 将 作业 放 在 挂 起 作业 列表 的 头 部 然后 延迟 1 分 钟 。 如 果 
~ 记 为 NULL， 此 时 只 需 回 到 循环 开始 处 ， 获 得 下 一 个 要 打印 的 作 
o 


[778~785] readmore 函 数 用 于 读 取 来 自打 印 机 的 部 分 啊 应 消息 。 
786 { 

787 ssize_t nr; 

788 char *bp = *bpp; 

789 int bsz =*bszp; 

790 if (off >= bsz) { 











791 bsz += IOBUFSZ; 

792 if ((bp = realloc(*bpp, bsz)) == NULL) 

793 log_sys("readmore: can’t allocate bigger read 
buffer"); 

794 *bszp =bsz; 

795 *bpp =bp; 

796 } 


797 if ((nr = tread(sockfd, &bp[off], bsz-off, 1)) > 0) 
798 return(off+nr); 


799 else 

800 return(-1); 

801 } 

802 /* 

803 * Read and parse the response from the printer. Return 1 
804 * if the request was successful, and 0 otherwise. 


805 * 

806 * LOCKING: none. 

807 */ 

808 int 

809 printer_status(int sfd, struct job *jp)810 { 

811 int i, success, code, len, found, bufsz, datsz; 
812 int32_t jobid; 

813 ssize_t nr; 

814 char *bp, *cp, *statcode, *reason, *contentlen; 
815 struct ipp_hdr h; 

816 /* 


817 * Read the HTTP header followed by the IPP response header. 

818 * They can be returned in multiple read attempts. Use the 

819 * Content-Length specifier to determine how much to read. 

820 */ 

[786 一 801] ”如 果 到 达 绥 冲 区 尾部 ， 通 过 相应 的 参数 bpp 和 bszp 重 新 
分 配 一 个 大 一 点 的 缓冲 区 并 返回 该 新 的 缓冲 区 的 起 始 地 址 以 及 缓冲 区 大 
小 。 上 述 任何 一 种 情况 下 ， 从 缓冲 区 已 读数 据 的 末尾 开始 读 取 绥 冲 区 所 
能 容纳 的 尽 可 能 多 的 数据 。 返 回 相应 的 已 读数 据 的 新 偏 移 量 。 如 果 read 
失败 ， 或 者 超时 ， 返 回 -1。 

[802 一 820] ”printer_status 函 数 读 取 打 印 机 对 一 个 打印 作业 请 求 的 啊 
应 消息 。 不 知道 打印 机 会 如 何 啊 应 :也 许 会 在 多 个 报 文中 回 送 一 个 啊 
应 ， 也 许 在 一 个 报 文中 回 送 完整 的 啊 应 ， 或 者 包括 一 个 中 间 确 认 ， 诸 如 
HTTP 100 Continue 报 文 。 需 要 处 理 所 有 的 可 能 性 。 

821 success =0 ; 

822 bufsz =IOBUFSZ; 

823 if ((bp = malloc(IOBUFSZ)) == NULL) 





824 log_sys("printer_status: can’t allocate read buffer"); 
825 while ((nr = tread(sfd, bp, bufsz, 5)) > 0) { 
826 /* 


827 * Find the status. Response starts with "HTTP/x.y" 


828 * so we can skip the first 8 characters. 


829 =) 

830 cp = bp + 8; 

831 datsz =nr; 

832 while (isspace((int)*cp)) 

833 cpt++; 

834 statcode =cp; 

835 while (isdigit((int)*cp)) 

836 cp++; 

837 if (cp == statcode) { /* Bad format; log it and move on */ 

838 log_msg(bp); 

839 } else { 

840 *cpt+ =’\0’; 

841 reason =cp; 

842 while (*cp != AT && *cp != ’\n’) 

843 cpt++; 

844 *cp =’\0’; 

845 code =atoi(statcode); 

846 if (HTTP_INFO(code)) 

847 continue; 

848 if (HTTP_SUCCESS(code)) { /* probable error: log 
it */ 

849 bp[datsz] =’\0’; 

850 log_msg("error: %s", reason); 

851 break; 

852 


} 
[821~838] 分 配 一 个 缓冲 区 并 读 取 来 自打 印 机 的 数据 ， 期 望 5 秒 之 
内 有 可 用 的 啊 应 。 跳 过 HTTP/1.1 和 报 文 开始 的 所 有 空格 ， 然 后 是 数字 状 
态 码 。 如 果 不 是 ， 在 日 志 中 记录 报 文 的 内 容 。 

[839 一 844] 如 果 在 响应 中 找到 一 个 数字 状态 码 ， 将 其 开始 的 非 数 字 
字符 转换 成 null 字 节 (这 一 字符 是 某 种 形式 的 空白 ) 。 接 下 来 是 一 个 表 
明 原 因 的 字符 串 ( 文 本 消息 ) 。 搜 索 回 车 或 换行 符 ， 并 采用 nul 字 节 结 
束 文 本 字符 串 。 

[845 一 852] 调用 atoi 函 数 将 状态 码 字 符 串 转化 成 一 个 整数 。 如 果 仪 
是 提供 信息 的 报 文 ， 将 其 忽略 并 继续 循环 。 我 们 期 望 看 到 的 要 么 是 成 功 
消息 要 么 是 出 错 消 息 。 如 果 得 到 出 错 消息 ， 记 录 出 错 日 志 并 退出 循环 。 

853 /* 














854 
855 
856 
857 
858 
859 
860 
861 
862 
863 
864 
0) { 
865 
866 
867 
868 
869 
870 
871 


872 
873 
874 
875 
876 
877 
878 
879 
880 
881 
882 
883 
884 
885 
886 


* HTTP request was okay, but still need to check 
* IPP status. Search for the Content-Length. 
= 
i= cp - bp; 
for (;;) { 
while (*cp != °C’ && *cp != °C’ && i < datsz) { 
cptt; 
i++; 
} 
if (i >= datsz) { /* get more header */ 
if (mr = readmore(sfd, &bp, i, &bufsz)) < 


goto out; 
} else { 
cp =&bpli]; 
datsz += nr; 
} 
} 
if (strncasecmp(cp, "Content-Length:", 15) == 0) 


cp += 15; 

while (isspace((int)*cp)) 
cpt++; 

contentlen =cp; 

while (isdigit((int)*cp)) 
cpt++; 

*cpt+ =\0’; 

i= cp - bp; 

len =atoi(contentlen); 

break; 

} else { 
cpt++; 
i++; 


} 


} 
[853 一 870] 如 果 HTTP 请 求 成 功 ， 需 要 检查 IPP 状 态 。 搜 索 整 个 报 文 


直到 找到 Content-Length 属 性 。HTTP 首部 的 关键 字 是 大 小 写 敏感 的 ， 





此 需要 同时 检查 小 写 和 大 写字 符 。 如 果 绥 冲 区 空间 耗 尽 ， 需 要 调用 
readmore， 通 过 它 再 调用 realloc 增 加 缓冲 区 大 小 。 

因为 缓冲 区 地 址 可 能 改变 ， 需 要 调整 cp 指 癌 正确 的 缓冲 区 位 置 。 

[871~886] ”使 用 strmcasecmp 函 数 进行 大 小 写 敏 感 比较 。 如 果 找 到 
Content-Length 属 性 字符 串 ， 束 搜索 它 的 值 。 将 数字 字符 串 转换 为 整数 
并 退出 这 个 for 循 环 。 如 果 比 较 失 败 ， 继 续 逐 个 字 节 搜索 缓冲 区 。 如 果 直 
到 缓冲 区 末尾 仍 未 找到 Content-Length 属 性 ， 就 从 打印 机 读 取 更 多 数据 
并 继续 搜索 。 








887 if (i >= datsz) { /* get more header */ 

888 if (Mr = readmore(sfd, &bp, i, &bufsz)) < 0) { 

889 goto out; 

890 } else { 

891 cp =&bp[i]; 

892 datsz += nr; 

893 } 

894 } 

895 found =0 ; 

896 while (!found) { /* look for end of HTTP header */ 

897 while (i < datsz - 2) { 

898 if (*cp == An && *(cp + 1) ==’\r && 

899 *(cp + 2) == ’\n’) { 

900 found =1 ; 

901 cp += 3; 

902 i += 3; 

903 break; 

904 } 

905 cp++; 

906 i++; 

907 } 

908 if (i >= datsz) { /* get more header */ 

909 if (mr = readmore(sfd, &bp, i, &bufsz)) < 
0) { 

910 goto out; 

911 } else { 

912 cp =&bp[i]; 

913 datsz += nr; 


914 } 


915 } 


916 } 

917 if (datsz - i < len) { /* get more header */ 

918 if (Mr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
919 goto out; 

920 } else { 

921 cp =&bp[i]; 

922 datsz += nr; 


[887~916] 现在 知道 报 文 的 长 度 了 (通过 Content-Length 属性 ) 。 
如 果 耗 义 缓冲 区 ， 那 么 从 打印 机 再 次 读 取 。 接 下 来 搜索 HTTP 首部 的 末 
尾 〈 衬 白 行 ) 。 如 果 找 到 了 ， 束 设置 found 标 志 并 跳 过 空白 行 。 无 论 何 
时 调用 readmore， 都 要 将 cp 设置 为 与 之 前 指 问 的 缓冲 区 仿 移 量 相同 ， 以 
防止 重 分 配 时 绥 冲 区 地 址 改变 。 

[917 一 922] 如 果 找 到 HTTP 首 部 的 末尾 ， 计 算 HTTP 首 部 所 用 的 字 节 
数 。 如 果 读 取 的 值 减 去 HTTP 首 部 的 大 小 后 不 等 于 IPP 报 文 的 数据 长 度 
《该 值 从 内 容 长 度 Content-Length 中 计算 ) ， 需 要 读 取 更 多 的 数据 。 

923 } 








924 } 

925 memcpy(&h, cp, sizeof) (struct ipp_hdr); 
926 i = ntohs(h.status); 

927 jobid = ntohl(h.request_id); 

928 if Gobid != jp->jobid) { 

929 /* 

930 * Different jobs. Ignore it. 

931 */ 

932 log_msg("jobid %d status code %d", jobid, i); 
933 break; 

934 } 

935 if (STATCLASS_OK(i)) 

936 success = 1; 

937 break; 

938 } 

939 } 

940 out: 

941 free(bp); 

942 if (nr < 0) { 


943 log_msg("jobid %d: error reading printer response: 


%s", 


944 jobid, strerror(errno)); 
945 } 

946 return(success); 

947 } 


[923~927] “从 IPP 首 部 中 获取 状态 和 作业 ID。 两 者 均 以 网 络 字 节 序 
的 整数 形式 存储 ， 因 此 需要 调用 ntohs 和 ntohl 将 其 转换 为 主机 字 节 序 。 

[928 一 939] 如 果 作 业 ID 不 匹配 ， 表 明 并 非 是 对 我 们 请 求 的 响应 ， 
那么 记录 日 志 并 退出 外 层 while 循 环 。 如 果 IPP 状 态 指示 为 成 功 ， 保 存 返 
回 值 并 退出 循环 。 

[940 一 947] 在 退出 之 前 ， 要 释放 用 来 存放 啊 应 报 文 的 缓冲 区 。 如 果 
打印 请 求 成 功 则 返回 1， 人 否则 失败 ， 返 回 0。 

这 里 总 结 本 章 中 这 个 扩展 的 例子 。 本 和 章 中 的 程序 在 Xerox Phaser 
8560 网 络 PostScript 打 印 机 上 测试 。 遗 憾 的 是 ， 当 文档 格式 设置 为 
text/plain 时 ， 这 个 打印 机 并 没有 禁止 它 的 自动 识别 格式 功能 。 我 们 使 用 
了 一 个 小 技巧 ， 使 得 在 想 要 以 纯 文 本 格式 对 竺 一 个 文档 时 ， 打 印 机 不 目 
动 识别 文档 格式 。 一 种 蔡 代 的 方法 是 使 用 诸如 a2ps(T) 这 样 的 实用 工具 
将 源 打印 成 一 个 PostScript 程序 。a2ps(1) 可 以 在 打印 前 封装 PostScript 程 
FF. 











21.6 小 结 


本 章 仔 细 考 查 了 两 个 完整 的 程序 : 一 个 打印 假 脱 机 守护 进程 将 作业 
发 送 到 网 络 打印 机 和 一 个 命令 行程 序 将 打印 作业 提交 到 假 脱 机 守护 进 
程 。 这 给 我 们 一 个 机 会 ， 考 查 在 一 个 实际 程序 中 使 用 前 面 章 节 所 讲述 的 
许多 特性 ， 如 线程 、L/O 多 路 技术 、 文 件 WO、 套 接 字 WO 以 及 信和 号。 


习题 


21.1 将 ipp.h 中 所 列 的 IPP 错 误 码 转换 成 错误 消息 。 然 后 修改 打印 假 
脱 机 守护 进程 ， 当 IPP 首 部 指示 有 打印 机 错误 时 ， 在 printer_status 函 数 结 
尾 处 记录 日 志 。 

21.2 增强 print 命 令 和 printd 守 护 进 程 ， 使 得 用 户 可 以 请 求 双 面 打 
印 ， 并 文 持 横 癌 打 印 和 纵向 打印 。 

21.3 修改 打印 假 脱 机 守护 进程 ， 当 其 开始 时 ， 能 够 联系 打印 机 并 找 
出 所 文 持 的 特性 ， 这 样 守 护 进 程 就 不 会 请 求 打 印 机 不 文 持 的 选项 。 

21.4 写 一 个 命令 行程 序 来 报告 挂 起 的 打印 作业 状态 。 

21.5 写 一 个 命令 行程 序 来 取消 一 个 挂 起 的 打印 作业 。 使 用 作业 ID 作 
ee 如 果 防 止 一 个 用 户 取 消 男 一 个 用 户 的 
TEREM? 

21.6 在 打印 假 脱 机 守护 进程 中 支持 多 个 打印 机 ， 并 包括 将 一 个 打印 
作业 从 本 打印 机 移 到 另 一 个 打印 机 的 方式 。 

21.7 解释 为 什么 在 打印 机 守护 进程 中 ， 当 信号 处 理 线 程 捕捉 到 
SIGHUP 并 将 reread 设置 为 1 时 ， 不 需要 唤醒 打印 机 线程 ? 

21.8 ”在 printer_status 函 数 中 ， 通 过 查找 HTTP 的 Content-Length 属 性 
搜索 IPP 报 文 的 长 度 。 这 一 技术 在 使 用 块 传输 编码 的 打印 机 上 不 起 作 
用 。 在 RFC 2616 中 碍 找 块 消息 是 如 何 格式 化 的 ， 然 后 修改 
printer_status， 使 其 也 能 够 支持 这 种 形式 的 啊 应 。 

21.9 在 update_jobno 函 数 中 ， 当 下 一 个 作业 编号 从 最 大 正 值 回 经 到 1 
时 《参见 get_newjobno) ， 可 能 会 将 一 个 较 大 的 编号 改写 为 一 个 较 小 的 
编写 。 这 可 能 导致 守护 进程 重启 时 读 到 一 个 错误 的 编号 。 对 于 这 一 问题 
是 否 有 简单 的 解决 方法 ? 

















附录 A 函数 原型 


本 附录 包含 了 正文 中 说 明 过 的 标准 ISO C、POSIX 和 UNIX 系 统 的 函 
数 原 型 。 通 常 我们 想 了 解 的 是 函数 的 参数 〈fgets 的 哪 一 个 参数 是 文件 指 
EF? ) 或 者 返回 值 (sprintf 返回 的 是 指针 还 是 计数 值 ? ) 。 这 些 函 数 原 
型 还 说 明了 要 包含 哪些 头 文件 ， 以 获得 特定 常量 的 定义 ， 或 获得 ISO C 
函数 原型 ， 以 帮助 在 编译 时 进行 错误 检测 。 

每 个 函数 原型 的 引用 页 号 出 现在 为 该 函数 列 出 的 第 一 个 头 文件 的 右 
边 。 引 用 页 号 提供 的 是 包含 该 函数 原型 的 页 。 为 获得 该 函数 原型 的 附加 
信息 可 参阅 该 页 。 

某 些 函数 原型 仅 受 本 书 说 明 的 4 种 平台 中 某 几 种 的 支持 。 另 外 ， 某 
些 平台 支持 的 函数 标志 在 男 一 些 平台 上 并 不 提供 支持 。 对 于 这 些 情况 ， 
e 但 是 对 于 有 些 情 况 ， 我 们 列 出 了 不 提供 

十 O 
本 附录 中 标注 的 页 码 为 英文 版 原 书 的 页 码 ， 与 书 中 页 边 标注 的 页 码 对 
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abort (void); 
<stdlib.h> p. 365 
SESE 
accept (int sockd, struct sockaddr *restrict addr, 
socklen t *restrict len); 


<sys/socket.h> p. 608 
返回 值 , AU, BAXE (ERP WEN: AURE- 


access (const char *path, int mode) ; 
<unistd.h> p. 102 
mode: R OK, WOK, xX OK, F_OK 
BEM: AA), BLO; AiR BEI 


aio cancel (int fd, struct aiocb *aioch) ; 
<aio.h> p.514 
返回 值 ，AIO ALLDONE, AIO CANCELED, ATO NOTCANCELED; 省 出 错 ， 返 四 -1 


aio error(const struct aiocb *aiach) ; 
《ai0,h> p.513 
返回 值 : ARERI, AEO EREDETE, B RINPROGRESS; A 
feki ER, 者 出错 ， 返 加 -1 


aio fsync (int op, struct aiocb *aioch) ; 
<alo.h> p.513 
BHR: ARON, WIL Os Aii B- 


aio_read(struct aiocb *aiocb); 
《ai0,h> p.512 
返回 值 ， 若 成 功 则 ， 返 回 0， 若 出 钳 则 返回 -1 


aio return(const struct aiocb *aiocb) ; 
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void 


speed t 


speed t 
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void 
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<aio.h> 


返回 值 : 异步 操作 的 结果 ; 若 出错 ， 返 回 -1 


aio_suspend(const struct aiocb *const list[], int nent, 
const struct timespec *timeout) ; 
<aio.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


aio_write (struct aiocb *aioch) ; 
<aio.h> 


返回 值 : 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


alarm(unsigned int seconds) ; 
<unistd.h> 


返回 值 : 0 或 以 前 设置 的 闹钟 时 间 的 余 留 秒 数 


atexit(void (*func) (void) ); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


bind (int sockfd, const struct sockaddr *addr, socklen_t len); 


<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*calloc (size t nobj, size_t size); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 非 空 指针 ; 若 出 错 ， 返 回 NULL 


cfgetispeed(const struct termios *fermptr) ; 
<termios.h> 


返回 值 : 返回 波 特 率 值 


cfgetospeed (const struct termios *termptr) ; 
<termios.h> 


返回 值 : 返回 波 特 率 值 
cfsetispeed (struct termios *fermptr, speed_t speed); 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


cfsetospeed(struct termios *fermptr, speed t speed); 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


chdir (const char *path) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


chmod (const char *path, mode_t mode) ; 
<sys/stat.h> 
mode: S IS[UG]ID. S ISVTX, 
S_I [RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


chown(const char *path, uid_t owner, gid_t group); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


clearerr (FILE *fp); 
<stdio.h> 





clock_getres(clockid_t clock id, struct timespec *tsp); 


S13 


.514 


e512 


. 338 


. 200 


. 604 


. 207 


. 692 


. 692 


. 692 


. 692 


; 135 


. 106 


. 109 


; 151 


int 


int 


int 


int 


int 


void 


unsigned 


char 


struct 
emsghdr 


unsigned 
int 


struct 
emsghdr 


<sys/time.h> p. 190 
clock_id: CLOCK_REALTIME, CLOCK MONOTONIC, 
CLOCK_PROCESS_CPUTIME_ID, 
CLOCK_THREAD CPUTIME ID 
返回 值 : 车 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


clock_gettime(clockid t clock_id, struct timespec *tsp); 
<sys/time.h> p. 189 
clock_id: CLOCK_REALTIME,. CLOCK_MONOTONIC, 
CLOCK_PROCESS_CPUTIME_ID. 
CLOCK THREAD CPUTIME ID 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


clock_nanosleep(clockid_t clock id, int flags, 
const struct timespec *reqtp, 
structtimespec *remip) ; 
<time.h> p. 375 
clock_id: CLOCK_REALTIME, CLOCK MONOTONIC, 
CLOCK_PROCESS CPUTIME ID, 
CLOCK_THREAD_CPUTIME_ID 
flags: TIMER_ABSTIME 
返回 值 : 若 休眠 够 要 求 的 时 间 ， 返 回 0; 若 失 败 ， 返 回 错误 码 


clock_settime(clockid_t clock id, const struct timespec *tsp) ; 
<sys/time.h> p. 190 
clock_id: CLOCK REALTIME、 CLOCK MONOTONIC, 
CLOCK PROCESS CPUTIME_ID, 
CLOCK THREAD CPUTIME ID 
返回 值 : FRJ, BE o 若 出 错 ， 返 回 -1 


close(int fd); 
<unistd.h> p. 66 
closedir(DIR *dp); 


<dirent.h> p. 130 
返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


closelog (void); 
<syslog.h> p. 470 


*CMSG_DATA (struct cmsghdr *cp); 
<sys/socket.h> p. 645 
返回 值 : 一 个 指针 ， 指 向 与 cmsghdr 结构 相关 联 的 数据 


*CMSG_FIRSTHDR(struct msghdr *mp); 
<sys/socket.h> p. 645 
返回 值 : 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 第 一 个 cmsghdr 结构 ; 若 
无 这 样 的 结构 ， 返 回 NULL 


CMSG LEN (unsigned int nbytes); 
<sys/socket.h> p. 645 


返回 值 : 为 nbytes 长 的 数据 对 象 分 配 的 长 度 


*CMSG_NXTHDR (struct msghdr *mp, struct cmsghdr *cp); 
<sys/socket.h> p. 645 
返回 值 : 一 个 指针 ， 指 向 与 msghaz 结构 相关 联 的 下 一 个 msghar 4444, Hmsghdr 


int 


int 


char 


int 


int 


int 


void 


void 


void 


void 


void 


void 


void 


int 


int 


int 


结构 给 出 了 当前 的 cmsghdr 结构 ; 若 当 前 cmsghdr 结构 已 是 最 后 一 


个 ， 返 回 


NULL 


connect (int sockfd, const struct sockaddr *addr, 


socklen t len); 


<sys/socket.h> 


返回 值 : 若 成 功 ， 


creat(const char *path, mode_t mode) ; 


<fentl.h> 


mode: S_IS[UG] ID, S_ISVTX, 
S_I[RWX] (USR|GRP| OTH) 


返回 值 : 若 成 功 ， 


*ctermid(char *ptr); 
<stdio.h> 
返回 值 : 若 成 功 ， 

指针 
dprintf (int fd, const char 
<stdio.h> 


返回 值 : 若 成 功 ， 
dup (int fd); 

<unistd.h> 

返回 值 : 若 成 功 ， 
dup2 (int fd, int fd2); 

<unistd.h> 


返回 值 : 若 成 功 ， 
endgrent (void) ; 
<grp.h> 


endhostent (void) ; 
<netdb.h> 


endnetent (void); 
<netdb.h> 


endprotoent (void); 
<netdb.h> 


endpwent (void) ; 
<pwd.h> 


endservent (void) ; 
<netdb.h> 


endspent (void); 
<shadow.h> 


p. 605 
返回 0; 若 出 错 ， 返 回 -1 

p. 66 
返回 为 只 写 打 开 的 文件 描述 符 ; 若 出 错 ， 返 回 -1 

p. 694 
返回 指向 控制 终端 名 的 指针 ， 若 出 错 ， 返 回 指向 空 字符 串 的 





*restrict format, ...); 


返回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


返回 新 的 文件 描述 符 ; 若 出 错 ， 返 回 -1 


返回 新 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


平台 : Linux 3.2.0、Solaris 10 


execl (const char *path, const char *arg0, ... /* (char *) 
<unistd.h> 
返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 
execle (const char *path, const char *arg0, ... /* (char *) 
char *const envp[] */ ); 
<unistd.h> 
返回 值 : 若 出 错 ， 返 回 -1;， ARI, MRE 


execlp(const char *filename, 
ee ieee =) QE 


const char *arg0, 


Of 2" HF 


0, 


p. 159 


p. 183 


p. 597 


p. 598 


p. 598 


p. 180 


p. 599 


p. 182 


p. 249 


p. 249 


int 


int 


int 


void 


void 


void 


int 


int 


int 


int 


int 


int 


<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 


execv(const char *path, char *const argv[]); 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1;， 者 成 功 ， 不 返回 


execve (Const char *path, char *const argv[], 
char *const envp[]); 
<unistd.h> 


execvp (const char *filename, char *const argv[]); 


<unistd.h> 

返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 
_Exit(int status) ; 

<stdlib.h> 

这 个 函数 从 不 返回 
_exit(int status) ; 

<unistd.h> 

这 个 函数 从 不 返回 
exit (int status) ; 


<stdlib.h> 
这 个 函数 从 不 返回 


faccessat(int fd, const char *path, int mode, int flag); 


<unistd.h> 

mode: R_ OK W OK、 X OK, F OK 

flag: AT_EACCESS 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
fchdir (int fd); 

<unistd.h> 


BMA: 若 成 功 ， 返 回 0; FH, BE- 


fchmod (int fd, mode_t mode) ; 
<sys/stat.h> 
mode: S IS[UG]ID. S_ISVTX, 
S_I[RWX] (USR|GRP| OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fchmodat (int fd, const char *path, mode t mode, 
<sys/stat.h> 
mode: S IS[UG]ID, S_ISVTX, 
S_I[RWX] (USR|GRP| OTH) 
flag: AT_SYMLINK_NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


Echown (int fd, uid t owner, gid t group); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; A, AE- 


fchownat (int fd, const char *path, uid t owner, 





gid_tgroup, int flag); 
<unistd.h> 
flag: AT_SYMLINK NOFOLLOW 
EME: 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int flag); 


. 249 


: 249 


. 249 


. 249 


. 198 


. 198 


. 198 


. 102 


. 135 


. 106 


. 106 


. 109 


. 109 


int 


int 


int 


void 


int 


FILE 


DIR 


void 


void 


int 


int 


int 


int 


int 


int 


char 


fclose (FILE *fp); 
<stdio.h> 


返回 值 : AAR, BE O0: Aisi, BE EOF 


fentl(int fd, int cmd, ... /* int arg */ ); 
<fentl.h> 
cmd: F_DUPFD, F_DUPFD_CLOEXEC, F_GETFD, 
F_SETFD, F_GETFL, F_SETFL, F_GETOWN, 
F_SETOWN, F_GETLK, F_SETLK, F_SETLKW 
返回 值 : 若 成 功 ， 依 赖 于 cmd; 若 出 错 ， 返 回 -1 


fdatasync (int fd); 
<unistd.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
平台 : Linux 3.2.0、Solaris 10 


FD_CLR(int fd, fd set *fdset) ; 
<sys/select.h> 


FD_ISSET(int fd, fd set *fdset) ; 
<sys/select.h> 


返回 值 : A fd FERRET. WEE 0 值 ， 和 否则， 返回 0 


*fdopen(int fd, const char *type); 
<stdio.h> 
type: Want "am. "an WE 二 nm、 "wH", nay" 


返回 值 : 若 成 功 ， 返 回 文 件 指针 ;， 若 出 错 ， 返 回 NULL 


*fdopendir (int fd); 
<dirent.h> 


返回 值 : 若 成 功 ， 返 回 指针 ;， 若 出 错 ， 返 回 NULL 


FD SET(int fd, fd set *fdset) ; 
<sys/select.h> 


FD_ZERO(fd_set *fdset) ; 
<sys/select.h> 


feof (FILE *fp); 
<stdio.h> 


返回 值 : 若 到 达 流 的 文件 尾 端 ， 返 回 非 0《〈 真 ) ; 和 否则， 返回 0《〈 假 ) 


ferror (FILE *fp); 
<stdio.h> 


返回 值 : 若 流出 错 ， 返 回 非 0 (A); 和 否则， 返回 0〈 假 ) 


fexecve (int fd, char *const argv[], char *const envp[]); 
<unistd.h> 


返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 值 


fflush(FILE *fp); 
<stdio.h> 


返回 值 : ARH, JRO; 若 出 错 ， 返 回 EOF 


fgetc (FILE *fp); 
<stdio.h> 


p 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文件 尾 端 或 出 错 ， 返 回 EOF 


fgetpos (FILE *restrict fp, fpos_t *restrict pos); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


*fgets(char *restrict buf, int n, FILE *restrict fp); 
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. 503 
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. 130 


. 503 


. 503 
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.249 


[852 


. 147 


150 
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int 


void 


FILE 


FILE 


pid_t 


long 


int 


int 


int 


size t 


void 


void 


FILE 


<stdio.h> p. 152 
返回 值 : 若 成 功 ， 返 回 buf; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 NULL 


fileno (FILE *fp); 


<stdio.h> p. 164 
返回 值 : 与 该 流 相关 联 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


flockfile (FILE *fp) ; 


<stdio.h> p. 443 


*fmemopen (void *restrict buf, size_t size, 
const char *restrict type); 


*fopen (const 


fork (void); 


<stdio.h> p. 171 
type: S haere Wig vany Tp "WH", man 


返回 值 : 若 成 功 ， 返 回流 指针 ; 若 错误 ， 返 回 NULL 


char *restrict path, const char *restrict type); 
<stdio.h> p. 148 
type: WE Wig hE Wa We "WH", "a+" 


返回 值 : GRH, BAXE Aih, el NULL 


<unistd.h> p. 229 
返回 值 : 若 在 子 进程 中 ， 返 回 0; 若 在 父 进程 中 ， 返 回 子 进程 ID; 若 出 错 ， 返 回 -1 


fpathconf (int fd, int name); 


<unistd.h> p. 42 
name: _PC_ASYNC_I0O, _PC_CHOWN_RESTRICTED, 
_PC_FILESIZEBITS, _PC_LINK_MAX, 
_PC_MAX CANON, PC MAX INPUT, 
PC_NAME MAX, PC NO TRUNC. _PC_PATH MAX, 
PC_PIPE_BUF, _PC_PRIO_IO, _PC_SYMLINK_MAX, 
_PC_SYNC_IO, _PC_TIMESTAMP_ RESOLUTION, 
_PC 2 SYMLINKS. _PC_VDISABLE 
返回 值 : 若 成 功 ， 返 回 相应 值 ; 若 出 错 ， 返 回 -1 








fprintf (FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 

fputc(int ce, FILE *fp); 
<stdio.h> p. 152 


返回 值 : ERD, BE c; 若 出 错 ， 返 回 EOF 


fputs(const char *restrict str, FILE *restrict fp); 


<stdio.h> p. 153 
返回 值 : 若 成 功 ， 返 回 非 负 值 ; 若 出 错 ， 返 回 EOF 


fread(void *restrict ptr, size_t size, size_t nobj, 
FILE *restrict fp); 


<stdio.h> p. 156 
返回 值 : 读 的 对 象 数 


free (void *ptr); 


<stdlib.h> p. 207 
freeaddrinfo (struct addrinfo *ai); 

<sys/socket.h> p. 599 

<netdb.h> 


*freopen (const char *restrict path, const char *restrict tpe, FILE *restrict fp); 


<stdio.h> p. 148 


int 


int 


int 


int 


int 


int 


int 


long 


off t 


key_t 


int 


int 


void 


int 


int 


type: nr, "Ww", "a", "r+", "w+", "a+" 


返回 值 : 若 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


fscanf (FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> 


p. 162 


返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


fseek (FILE *fp, long offset, int whence); 
<stdio.h> 
whence: SEEK_SET, SEEK CUR, SEEK END 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fseeko (FILE *fp, off_t offset, int whence) ; 
<stdio.h> 
whence: SEEK SET、 SEEK CUR, SEEK END 
返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 


fsetpos (FILE *fp, const fpos_t *pos); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


fstat (int fd, struct stat *buf); 
<sys/stat.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 -1 


fstatat(int fd, const char *restrict path, 
struct stat *restrict buf, int flag); 
<sys/stat.h> 
flag: AT SYMLINK NOFOLLOW 
返回 值 : ARJ; 返回 0; 若 出 错 ， 返 回 -1 


fsync (int fd); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 则 返回 -1 


ftell (FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 当前 文件 位 置 指示 器 ; 车 出 错 ， 返 回 -1L 


ftello(FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 当前 文件 位 置 指示 器 ; 若 出 错 ， 返 回 (off_t)-1 


ftok (const char *path, int id); 
<sys/ipc.h> 
返回 值 : 若 成 功 ， 返 回 键 ; 若 出 错 ， 返 回 (key _t)-1 


ftruncate (int fd, off t length); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 --1 


ftrylockfile (FILE *fp); 
<stdio.h> 


返回 值 : FRH, E 0;， 若 不 能 获取 锁 ， 返 回 非 0 数值 


funlockfile (FILE *fp); 
<stdio.h> 


futimens (int fd, const struct timespec times[2]); 
<sys/stat.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


fwide (FILE *fp, int mode); 


p. 158 


p. 158 


p. 158 


p. 81 


p. 158 


p. 158 


p. 557 


p. 112 


p. 443 


p. 126 


size 七 


const 
char 


int 


int 


ane 


int 


int 


char 


gid t 


char 


uid t 


gid t 


struct 
group 


<stdio.h> p. 


<wchar.h> 


返回 值 : 若 流 是 宽 定向 的 ， 返 回 正 值 ; AAP HEA, BEA; 若 流 是 


未 定向 的 ， 返 回 0 


fwrite(const void *restrict ptr, size_t size, size_t nobj, 
FILE *restrict fp); 


<stdio.h> p. 


返回 值 : 写 的 对 象 数 


*gai_strerror(int error); 


<netdb.h> p. 


返回 值 : 指向 描述 错误 的 字符 串 的 指针 


getaddrinfo(const char *restrict host, const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 


<sys/socket.h> p. 


<netdb.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 错误 码 


getc (FILE *fp) ; 


<stdio.h> p- 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 


getchar (void); 


<stdio.h> p. 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 


getchar_unlocked (void); 


<stdio.h> p- 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 


getc unlocked (FILE *fp); 


<stdio.h> p: 


返回 值 : 若 成 功 ， 返 回 下 一 个 字符 ; 车 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 


*getcwd (char *buf, size t size); 


<unistd.h> p- 


返回 值 : 若 成 功 ， 返 回 puf; 若 出 错 ， 返 回 NULL 
getegid (void); 


<unistd.h> p. 


返回 值 : 调用 进程 的 有 效 组 ID 


*getenv (const char *name); 


<stdlib.h> P: 


返回 值 : 指向 与 name 关联 的 value 的 指针 ; 车 未 找到 ， 返 回 NULL 


geteuid (void); 


<unistd.h> p- 


返回 值 : 调用 进程 的 有 效用 户 ID 
getgid (void); 


<unistd.h> p- 


返回 值 : 调用 进程 的 实际 组 ID 


*getgrent (void); 


<grp.h> p. 


返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 或 到 达 文件 尾 端 ， 返 回 NULL 
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SELES 
netent 


struct 
netent 


int 


int 


*getgrgid(gid t gid); 
<grp.h> 
返回 值 : 若 成 功 ， 返 回 指 针 ; 若 出 错 ， 返 回 NULL 


*getgrnam(const char *name) ; 
<grp.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


getgroups (int gidsetsize, gid t grouplist[]); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 附属 组 ID 数量 ; 若 出 错 ， 返 回 -1 


*gethostent (void); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


gethostname (char *name, int namelen) 7 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*getlogin (void) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 指向 登录 名 字符 串 的 指针 ; 若 出 错 ， 返 回 NULL 


getnameinfo(const struct sockaddr *restrict addr, 

socklen_t alen, char *restrict host, 

socklen_t hostlen, char *restrict service, 

socklen_t servien, unsigned int flags); 

<sys/socket.h> 

<netdb.h> 

flags: NI_DGRAM, NI_NAMEREQD, NI_NOFQDN, 
NI_NUMERICHOST. NI_NUMERICSCOPE, 
NI_NUMERICSERV 

返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 值 


*getnetbyaddr (uint32 t net, int type); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getnetbyname (const char *name) ; 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ;， 若 出 错 ， 返 回 NULL 


*getnetent (void); 
<netdb.h> 
返回 值 : ARI, GRRE; 若 出 错 ， 返 回 NULL 


getopt(int argc, char * const argv[], const char *options) ; 


<fentl.h> 
extern int opterr, optind, optopt; 
extern char *optarg; 


返回 值 : 下 一 个 选项 字符 ; 若 所 有 选项 被 处 理 完 ， 返 回 -1 


getpeername (int sockfd, struct sockaddr *restrict addr, 
socklen_t *restrict alenp) ; 


p. 600 


. 182 


. 182 


. 184 


+597 


. 188 


. 275 


; 598 


. 598 


. 598 


. 662 


pid t 


pid t 


Pid E 


pid t 


int 


struct 
protoent 


struct 
protoent 


struct 
protoent 


struct 
passwd 


struct 
passwd 


struct 
passwd 


int 


<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


getpgid(pid t pid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 进程 组 ID; iht el- 


getpgrp (void); 
<unistd.h> 


返回 值 : 调用 进程 的 进程 组 ID 


getpid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 进程 ID 


getppid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 父 进程 ID 


getpriority (int which, id t who); 
<sys/resource.h> 
which: PRIO PROCESS, PRIO PGRP、 PRIO USER 


返回 值 : 若 成 功 ， 返 回 -NZERO 一 NZERO-1 [J nice (4; 若 出 错 ， 返 回 -1 


*getprotobyname (const char *name) ; 
<netdb.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getprotobynumber (int proto); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getprotoent (void) ; 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getpwent (void); 
<pwd.h> 


返回 值 : 若 成 功 ， 返 回 指针 ;， 若 出 错 或 到 达 文件 尾 端 ， 返 回 NULL 


*getpwnam(const char *name) ; 
<pwd.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getpwuid (uid t uid); 
<pwd.h> 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


getrlimit(int resource, struct rlimit *riptr); 
<sys/resource.h> 
resource: RLIMIT CORE, RLIMIT_ CPU, 
RLIMIT DATA, RLIMIT FSIZE, 
RLIMIT NOFILE, RLIMIT STACK, 
RLIMIT_AS (FreeBSD 8.0, Linux 3.2.0. 
Solaris 10) , 


RLIMIT MEMLOCK (FreeBSD 8.0, Linux 3.2.0, 
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Mac OS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux 3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0. Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT SIGPENDING (Linux 3.2.0) , 
RLIMIT SWAP (FreeBSD 8.0) , 
RLIMIT VMEM (Solaris 10) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*gets (char *buf) ; 
<stdio.h> 


返回 值 : ARJ, RE buf; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 NULL 


*getservbyname (const char *name, const char *proto) ; 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getservbyport (int port, const char *proto) ; 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getservent (void); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


getsid(pid_t pid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -1 


getsockname (int sockfd, struct sockaddr *restrict addr, 
socklen 七 *restrict alenp) ; 
<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


getsockopt (int sockfd, int level, int option, void *restrict val, 
socklen_t *restrict lenp); 
<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -! 


*getspent (void); 
<shadow.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
平台 : Linux 3.2.0、Solaris 10 


*getspnam(const char *name); 
<shadow.h> 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 
平台 : Linux 3.2.0、Solaris 10 


gettimeofday (struct timeval *restrict fp, 
void *restrict p)? 
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<sys/time.h> 
返回 值 : 总 是 返回 0 
getuid (void); 


<unistd.h> 


返回 值 : 调用 进程 的 实际 用 户 ID 


*gmtime (const time t *calptr) ; 
<time.h> 


返回 值 : 指向 分 解 的 tm 结构 的 指针 ; 若 出 错 ， 返 回 NULL 


grantpt (int fd); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


htonl (uint32 t hostint32) ; 
<arpa/inet.h> 


返回 值 : 以 网 络 字 节 序 表 示 的 32 位 整数 


htons (uint16 t hostintl6) ; 
<arpa/inet.h> 


返回 值 : 以 网 络 字 节 序 表示 的 16 位 整数 


*inet_ntop(int domain, const void *restrict addr, 
char *restrict str, socklen_t size); 
<arpa/inet.h> 


返回 值 : 若 成 功 ， 返 回 地 址 字符 串 指 针 ; 若 出 错 ， 返 回 NULL 


inet_pton(int domain, const char *restrict str, 
void *restrict addr); 
<arpa/inet.h> 


返回 值 : 若 成 功 ， 返 回 1;， 若 格式 无 效 ， 返 回 0; FE, E- 


initgroups (const char *username, gid_t basegid) ; 
<grp.h> /* Linux & Solaris */ 
<unistd.h> /* FreeBSD & Mac OS X */ 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


ioctl(int fd, int request, ...); 
<unistd.h> /* System V */ 
<sys/ioctl.h> /* BSD and Linux */ 
返回 值 : 若 出 错 ， 返 回 -1; 若 成 功 ， 返 回 其 他 值 


isatty(int fd); 
<unistd.h> 


返回 值 : 若 为 终端 设备 ， 返 回 1 (A); 否则 ， 返 回 0( 假 》 


kill (pid t pid, int signo); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


lchown (const char *path, uid_t owner, gid_t group); 
<unistd.h> 


返回 值 : 若 成 功 ， 返回 0; a th jk [e]-1 


link(const char *existingpath, const char *newpath) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; At, E- 


linkat (int efd, const char *existingpath, int nfd, 
const char *newpath, int flag); 
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<unistd.h> p. 116 
flag: AT_SYMLINK_ NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int lio_listio(int mode, struct aiocb *restrict const list[restrict], 
int nent, struct sigevent *restrict sigev) ; 
<aio.h> p. 515 
mode: LIO NOWAIT, LIO WAIT 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int listen (int sockfd, int backlog) ; 
<sys/socket.h> p. 608 
返回 值 : 若 成 功 ， 返 回 0; Æi, el- 
struct 
tm *localtime (const time t *calptr) ; 
<time.h> p. 192 
返回 值 : 指向 分 解 的 tm 结构 的 指针 ; 若 出 错 ， 返 回 NULL 
void longjmp (jmp buf env, int val); 
<setjmp.h> p. 215 
这 个 函数 不 返回 
Ger vt lseek(int fd, off_t offset, int whence) ; 
<unistd.h> p. 67 
whence: SEEK SET, SEEK CUR. SEEK END 
返回 值 : 若 成 功 ， 返 回 新 的 文件 偏 移 量 ; 若 出 错 ， 返 回 -1 
int lstat(const char *restrict path, struct stat *restrict buf); 
<sys/stat.h> p. 93 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
void *malloc(size t size); 
<stdlib.h> p. 207 
返回 值 : 若 成 功 ， 返 回 非 空 指针 ; 若 出 错 ， 返 回 NULL 
int mkdir(const char *path, mode_t mode) ; 
<sys/stat.h> p. 129 
mode: S_IS[UG] ID; S_ISVTX, 
S_I [RWX] (USR |GRP | OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int mkdirat(int fd, const char *path, mode t mode); 
<sys/stat.h> p. 129 
mode: S_IS[UG] ID; S_ISVTX, 
S_I [RWX] (USR |GRP | OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
char *mkdtemp (char *femplate) ; 
<stdlib.h> p. 169 
返回 值 : 若 成 功 ， 返 回 指向 目录 名 的 指针 ， 若 出 错 ， 返 回 NULL 
int mkfifo (const char *path, mode_t mode); 
<sys/stat.h> p. 553 
mode: S_IS[UG] ID; S_ISVTX, 
S_I [RWX] (USR|GRP| OTH) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
int mkfifoat(int fd, const char *path, mode_t mode) ; 


<sys/stat.h> DS3 
mode: S_IS[UG]ID, S_ISVTX, 
S_I[RWX] (USR|GRP|OTH) 


int 


time 七 


void 


int 


int 


int 


ssize t 


int 


int 


int 


int 


int 


uint32_t 


返回 值 : ARH, RE 0; 若 出 错 ， 返 回 -1 


mkstemp (char *femplate) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 


mktime (struct tm *émptr); 
<time.h> 
返回 值 : 若 成 功 ， 返 回 日 历时 间 ; 若 出 错 ， 返 回 -1 

*mmap (void *addr, size_t len, int prot, int flag, int fd, 

off_t off); 

<sys/mman.h> 
prot: PROT_READ. PROT _WRITE. PROT_EXEC. PROT_NONE 
flag: MAP FIXED, MAP SHARED, MAP_PRIVATE 


返回 值 : 车 成 功 ， 返 回 映射 区 的 起 始 地 址 ; 若 出 错 ， 返 回 MAP_FAILED 


mprotect (void *addr, size t len, int prot); 
<sys/mman.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
msgctl (int msqid, int cmd, struct msqid_ds *buf); 
<sys/msg.h> 
cmd: IPC STAT、~ IPC SET、 IPC RMID 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


msgget (key t key, int flag); 
<sys/msg.h> 
flag: IPC_CREAT, IPC_EXCL 
返回 值 : 若 成 功 ， 返 回 消息 队列 ID: 若 出 错 ， 返 回 -1 


msgrcv (int msgid, void *ptr, size_t nbytes, long type, int flag); 
<sys/msg.h> 
flag: IPC_NOWAIT, MSG NOERROR 
返回 值 : 若 成 功 ， 返 回 消 息 数据 部 分 的 长 度 ; 若 出 错 ， 返 回 -1 


msgsnd(int msgid, const void *ptr, size_t nbytes, int flag); 
<sys/msg.h> 
flag: IPC_NOWAIT 
返回 值 : 郑成功， 返回 0; 若 出 错 ， 返 回 -1 


msync (void *addr, size_t len, int flags); 
<sys/mman.h> 
flag: MS ASYNC, MS_INVALIDATE. MS_SYNC 


munmap (void *addr, size_t len); 
<sys/mman.h> 


返回 值 : 若 成 功 ， 返 回 0; FHH, BE- 


nanosleep(const struct timespec *reqtp, 
struct timespec *remtp) ; 
<time.h> 
返回 值 : 若 休 了 眠 够 要 求 的 时 间 ， 返 回 0; 车 出 错 ， 返 回 -1 
nice (int incr); 


<unistd.h> 


返回 值 : 若 成 功 ， 返 回 新 的 nice 值 减 掉 NZERO; 车 出 错 ， 返 回 -1 


ntohl (uint32_t netint32); 
<arpa/inet.h> 


返回 值 : 以 主机 字 节 序 表 示 的 32 位 整数 
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Dint16 七 ntohs (uint16 t netint/6) ; 
<arpa/inet.h> p. 594 
返回 值 ， 以 主机 字 节 序 表示 的 16 位 整数 


int open (const char *path, int oflag, ... /* mode_t mode */ ); 
<fentl.h> p. 62 
oflag: O_RDONLY. O WRONLY. O_RDWR. O EXEC, 
O_SEARCH; 
O_APPEND, O_CLOEXEC. O_CREAT. 
O DIRECTORY. O_DSYNC. O EXCL, 
O_NOCTTY. O_NOFOLLOW. O_NONBLOCK, 
O_RSYNC,. © SYNC., O_TRUNC, O_TTY_INIT 
mode: S_IS[UG]ID. S_ISVTX, 
S_I [RWX] (USR|GRP| OTH) 
返回 值 : AAR. IBAA: 若 出 错 ， 返 回 -1 
平台 : 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 还 有 一 个 O_FSYNC 标志 


int openat (int fd, const char *path, int oflag, ... 
/* mode_t mode */ ); 
<fcentl.h> p. 62 
oflag: O_RDONLY. O_WRONLY. O_RDWR. O EXEC, 
O_SEARCH; 


O_APPEND, O_CLOEXEC, O_CREAT, 
O_DIRECTORY. O_DSYNC., O_EXCL, 
O_NOCTTY. O_NOFOLLOW. O_NONBLOCK, 
O_ RSYNC. O_SYNC. O_TRUNC. O TTY INIT 
mode: S_IS[UG] ID, S_ISVTX, 
S_I[RWX] (USR|GRP|OTH) 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 
平台 : 在 FreeBSD 8.0 fil Mac OS X 10.6.8 中 还 有 一 个 CO_FSYNC 标志 


DIR *opendir(const char *path) ; 
<dirent.h> p. 130 
返回 值 : 若 成 功 ， 返 回 指针 ; 车 出 错 ， 返 回 NULL 

void openlog (const char *ident, int option, int facility) ; 
<syslog.h> p. 470 


option: LOG CONS、 LOG_NDELAY. LOG NOWAIT. 
LOG_ODELAY, LOG PERROR, LOG PID 

facility: LOG AUTH、 LOG_AUTHPRIV. LOG_CRON, 
LOG DAEMON、 LOG_FTP, LOG _ KERN, 
LOG_LOCAL[0-7]. LOG_LPR. LOG MAIL、 
LOG NEWS、 LOG SYSLOG., LOG_USER, LOG UUCP 


FILE *open_memstream(char **hbufp, size 七 *sizep); 
<stdio.h> p. 173 
返回 值 : 若 成 功 ， 返 回流 指针 ， 若 出 错 ， 返 回 NULL 

FILE *open_wmemstream(wchar t **bufp, size_t *sizep); 
<wchar.h> p. 173 
返回 值 : 若 成 功 ， 返 回流 指针 ， 若 出 错 ， 返 回 NULL 

long pathconf (const char *path, int name); 
<unistd.h> p. 42 


name: _PC ASYNC IO、~ PC CHOWN RESTRICTED、 
_PC_FILESIZEBITS. _PC LINK MAX、 
_PC MAX CANON. PC MAX INPUT. 
_PC NAME MAX. _PC_NO TRUNC. PC PATH MAX, 
_PC_PIPE_ BUF. _PC_PRIO_I0O. _PC_SYMLINK_MAX, 
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pause (void); 


PC_SYNC_IO, _PC_TIMESTAMP_RESOLUTION, 
_PC_2_SYMLINKS, _PC_VDISABLE 
返回 值 ， 若 成 功 ， 返 回 相应 值 ; 若 出 错 ， 返 回 -1 





<unistd.h> p. 338 
返回 值 : -1, errno 设置 为 EINTR 


pclose (FILE *fp); 


perror (const 


<stdio.h> p. 541 
返回 值 : 若 成 功 ， 返 回 popen 函数 中 emdstring 的 终止 状态 ; 若 出 错 ， 返 回 -1 


char *msg); 


<stdio.h> p. 15 


pipe (int fd[2]); 


<unistd.h> p. 535 


poll(struct pollfd fdarray[], nfds_t nfds, int timeout) ; 


*popen (const 


<poll.h> p. 506 
返回 值 : 准备 就 绪 的 描述 符 数 ， 着 超 时， 返回 0; 若 出 错 ， 返 回 -1 


char *cmdstring, const char *type); 
<stdio.h> p. 541 
type: eer, ww" 


返回 值 : 若 成 功 ， 返 回 文 件 指针 ; 若 出 错 ， 返 回 NULL 


posix_openpt (int oflag) ; 


pread(int fd, 


printf (const 


<stdlib.h> p. 722 
<fcntl.h> 

oflag: O_RWDR. O_NOCTTY 

返回 值 : 若 成 功 ， 返 回 下 一 个 可 用 的 PTY 主 设备 文件 描述 符 ; 若 出 错 ， 返 回 -1 


void *buf, size_t nbytes, off_t offset); 
<unistd.h> p. 78 
返回 值 ， 读 到 的 字 节 数 ， 若 已 到 达 文 件 尾 端 ， 返 回 0; 若 出 错 ， 返 回 -1 


char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 车 成 功 ， 返 回 输出 字符 数 ; 若 输出 出 错 ， 返 回 负 值 


pselect (int maxfdpl, fd set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 
const struct timespec *restrict ispir, 
const sigset_t *restrict sigmask) ; 


<sys/select.h> p. 506 
返回 值 : 准备 就 绪 的 描述 符 数 ; 若 超 时 ， 返 回 0; 若 出 错 ， 返 回 -1 


psiginfo(const siginfo_t *info, const char *msg); 


<signal.h> p. 379 


psignal (int signo, const char *msg); 


<signal.h> p. 379 
<siginfo.h> /* on Solaris */ 


pthread_atfork (void (*prepare) (void), void (*parent) (void), 


void (*child) (void) ); 
<pthread.h> p. 458 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


Pthread attr destroy (pthread attr t “*attr); 


<pthread.h> p. 427 
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int 


int 


int 


int 
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int 


返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr_getdetachstate (const pthread attr t *attr, 
int *detachstate) ; 
<pthread. h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_attr_getguardsize(const pthread attr t 
*restrict attr, 
size_t *restrict guardsize) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread attr getstack (const pthread_attr_t *restrict attr, 
void **restrict stackaddr, 
size_t *restrict stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
pthread_attr_getstacksize(const pthread attr t 
*restrict attr, 
size_t *restrict stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_attr_init (pthread attr _t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_attr_setdetachstate (pthread attr t *attr, 
int detachstate) ; 
<pthread.h> 
detachstate: PTHREAD_CREATE_DETACHED, 
PTHREAD CREATE JOINABLE 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread attr setguardsize (pthread attr t *attr, 
size t guardsize) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
pthread attr setstack (const pthread attr t *atr, 
void *stackaddr, size_t *stacksize) ; 


<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0 否则， 返回 错误 编号 


pthread _attr_setstacksize(pthread attr t *attr, 
size t stacksize) ; 
<pthread.h> 
返回 值 ， 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_barrierattr_destroy (pthread barrierattr t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread _barrierattr_getpshared(const pthread _barrierattr t 
*restrict attr, 
int *restrict pshared) ; 
<pthread.h> 


返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_barrierattr_init (pthread barrierattr_t *attr); 


p. 428 


p. 430 


p. 429 


p. 430 


p. 427 


p. 428 


p. 430 


p. 429 


p. 430 


p. 441 


p. 441 


<pthread.h> p. 441 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


int pthread _barrierattr_setpshared (pthread barrierattr_t *attr, 
int pshared) ; 
<pthread.h> p. 441 
pshared: PTHREAD PROCESS PRIVATE, 
PTHREAD PROCESS _ SHARED 
返回 值 : 车 成功， 返回 0; 否则 ， 返 回 错误 编号 


int pthread barrier destroy (pthread barrier t *harrier) ; 
<pthread.h> p. 418 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 

int pthread_barrier_init (pthread barrier t *restrict harrier, 


constpthread_barrierattr_t 
*restrict attr, 
unsigned int count); 


<pthread.h> p. 418 
返回 值 : WRH, BE o 和 否则， 返回 错误 编号 

int pthread barrier_wait (pthread barrier t *hbarrier) ; 
<pthread.h> p. 419 


返回 值 : 若 成 功 ， 返 回 0 或 者 PTHREAD BARRIER SERIAL THREAD; 
和 否则， 返回 错误 编号 


int pthread_cancel (pthread t tid); 
<pthread.h> p. 393 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
Void pthread _ cleanup pop (int execute) ; 
<pthread.h> p. 394 
void pthread cleanup push(void (*rin) (void *), void *arg); 
<pthread.h> p. 394 
int pthread _condattr_destroy (pthread _condattr_t *attr) ; 
<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
int pthread_condattr_getclock (const pthread_condattr_t 


*restrict attr, 
clockid_ t *restrict clock_id); 


<pthread.h> p. 441 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
int pthread_condattr_getpshared (const pthread _condattr t 


*restrict attr, 
int *restrict pshared) ; 


<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
int pthread_condattr_init (pthread _condattr_t *attr) ; 
<pthread.h> p. 440 
返回 值 : 若 成 功 ， 返 回 0 否则， 返回 错误 编号 
int pthread _condattr_setclock (pthread condattr t ‘attr, 
clockid_t clock_id); 
<pthread.h> p. 441 


返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


int pthread _condattr_setpshared (pthread condattr t *attr, 


int 


int 


int 


int 


int 


int 


int 


int 


int 


void 


void 


int 


int 


int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE, 
PTHREAD PROCESS_SHARED 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_cond_broadcast (pthread cond t *cond) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


Pthread cond destroy (pthread cond t *cond) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_cond_init (pthread cond t *restrict cond, 


const pthread_condattr_t *restrict attr); 


<pthread.h> 


返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_cond_signal (pthread cond_t *cond) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread_cond_timedwait (pthread cond 七 *restrict cond, 
pthread mutex t *restrict mutex, 


const struct timespec 
*restrict timeout); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


Pthread cond wait (pthread cond t *restrict cond, 
pthread_mutex_t *restrict mutex); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread create (pthread t *restrict fidp, 
const pthread attr t *restrict attr, 
void *(*start_rin) (void *), 
void *restrict arg); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 
pthread detach (pthread t tid); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_equal (pthread t tidl, pthread_t tid2); 
<pthread.h> 


返回 值 : 车 相等 ， 返 回 非 0 数值 ， 否 则 ， 返 回 0 


pthread_exit(void *rval ptr); 
<pthread.h> 


*pthread getspecific(pthread key t key); 
<pthread.h> 


返回 值 : 线程 特定 数据 值 ; 若 没 有 值 与 该 键 关 联 ， 返 回 NULL 


pthread_join (pthread t thread, void **rval ptr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread key create (pthread key t *keyp, 


p. 440 


p.415 


p. 414 


p. 414 


p.415 


p. 414 


p. 414 


p. 385 


p. 397 


p. 385 


p. 389 


p. 449 


p. 389 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


void (*destructor) (void *)); 
<pthread.h> 
返回 值 : 车 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


Pthread key delete (pthread key t key); 
<pthread.h> 
返回 值 : AAT, LO; AM, RRS 


pthread_kill(pthread_t thread, int signo) ; 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_mutexattr_destroy (pthread mutexattr_t *attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread mutexattr_getpshared(const pthread mutexattr t 
*restrict attr, 
int *restrict pshared) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_mutexattr_getrobust (const pthread mutexattr_t 
*restrict attr, 
int *restrict robust); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
pthread_mutexattr_gettype (const pthread mutexattr_t 
*restrict attr, 
int *restrict type); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutexattr_init (pthread mutexattr_t *attr); 
<pthread.h> 
返回 值 : 车 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_mutexattr_setpshared (pthread mutexattr_t *attr, 
int pshared) ; 
<pthread.h> 
pshared: PTHREAD_PROCESS_PRIVATE, 
PTHREAD_PROCESS_ SHARED 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread mutexattr_setrobust (pthread mutexattr_t *attr, 
int robust); 
<pthread.h> 
robust: PTHREAD_MUTEX_ROBUST. 
PTHREAD_MUTEX_STALLED 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


Pthread mutexattr settype (pthread mutexattr 七 #*attr, int type); 


<pthread.h> 

type: PTHREAD MUTEX NORMAL, 
PTHREAD MUTEX _ERRORCHECK, 
PTHREAD MUTEX RECURSIVE, 
PTHREAD_MUTEX_DEFAULT 

返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


Pthread mutex consistent (pthread mutex t *mutex) ; 
<pthread.h> 


p. 447 


p. 448 


p. 455 


p. 431 


p. 431 


p. 432 


p. 434 


p. 431 


p. 431 


p. 432 


p. 434 


p. 433 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 


pthread mutex destroy (pthread mutex 七 *mutex) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutex init(pthread mutex t *restrict mutex, 
const pthread mutexattr t *restrict attr); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread mutex lock (pthread mutex t *mutex) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_mutex_timedlock (pthread mutex t *restrict mutex, 
const struct timespec *restrict fsptr); 
<pthread.h> 
<time.h> 


返回 值 : 若 成 功 则 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread _mutex_trylock (pthread mutex 七 *mutex) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread_mutex_unlock (pthread mutex 七 *mutex) ; 
<pthread.h> 


返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


Pthread_once (pthread once t *initflag, void (*initfn) (void)); 
<pthread.h> 
pthread_once_t initflag= PTHREAD_ONCE_INIT; 
返回 值 : 若 成 功 ， 返 回 O; 否则， 返回 错误 编号 
pthread_rwlockattr_destroy (pthread _rwlockattr_t *attr); 


<pthread.h> 
返回 值 : 若 成 功 ， 返 回 O; 否则 ， 返 回 错 误 编 号 


pthread_rwlockattr_getpshared(const pthread rwlockattr t 
*restrict attr, 
int *restrict pshared) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_rwlockattr_init (pthread rwlockattr_t *altr); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


Pthread rwlockattr setpshared (pthread rwlockattr t *attr, 
int pshared) ; 
<pthread.h> 
pshared: PTHREAD_ PROCESS PRIVATE, 
PTHREAD_ PROCESS _ SHARED 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread_rwlock_destroy (pthread rwlock t *rwlock) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlock init(pthread rwlock t *restrict rwlock, 
const pthread rwlockattr_t 
*restrict attr); 


p. 400 


p. 400 


p. 400 


p. 407 


p. 400 


p. 400 


p. 448 


p. 439 


p. 440 


p. 439 


p: 440 


p. 409 


<pthread.h> p. 409 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


int pthread_rwlock_rdlock (pthread rwlock t *rwilock) ; 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 

int pthread_rwlock_timedrdlock (pthread rwlock t *restrict rwlock, 


const struct timespec 
*restrict tsptr); 


<pthread.h> p. 413 
<time.h> 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 

int pthread_rwlock_timedwrlock (pthread rwlock t *restrict rwiock, 


const struct timespec 
*restrict tsptr) ; 


<pthread.h> p. 413 
<time.h> 
返回 值 : 若 成 功 ， 返 回 0: AM, weiss 

int pthread_rwlock_tryrdlock (pthread rwlock t *rwilock) ; 
<pthread.h> p. 410 
返回 值 : AM, EO; 和 否则， 返回 错误 编号 

int pthread_rwlock_trywrlock (pthread _rwlock_t *rwiock) ; 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0; 否则， 返回 错误 编号 

int pthread_rwlock_unlock (pthread rwlock t *rwilock) ; 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 

int pthread_rwlock_wrlock (pthread rwlock t *rwiock) ; 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 O; 否则， 返回 错误 编号 

pthread 七 pthread_self (void); 
<pthread.h> p. 385 
返回 值 : 调用 线程 的 线程 ID 

int pthread_setcancelstate(int state, int *oldstate) ; 
<pthread.h> p. 451 


state: PTHREAD_CANCEL_ENABLE, 
PTHREAD_CANCEL_DISABLE 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


int pthread_setcanceltype(int type, int *oldtype); 
<pthread.h> p. 453 
type: PTHREAD CANCEL DEFERRED, 
PTHREAD CANCEL ASYNCHRONOUS 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


int pthread_setspecific(pthread key t key, const void *value) ; 
<pthread.h> p. 449 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


int pthread_sigmask(int how, const sigset_t *restrict set, 
sigset_t *restrict oset); 
<signal.h> p. 454 
how: SIG_BLOCK. SIG UNBLOCK. SIG _SETMASK 
返回 值 : FRH, GRO; 否则， 返回 错误 编号 


int 


int 


int 


int 


int 


void 


char 


int 


int 


int 


int 


int 


int 


ssize t 


int 


ssize t 


pthread_spin_destroy (pthread _spinlock t *lock) ; 


<pthread.h> 
返回 值 : 若 成 功 ， 


返回 0， 否则， 返回 错误 编号 


pthread spin init(pthread spinlock t *lock, int pshared) ; 


<pthread.h> 


pshared: PTHREAD PROCESS PRIVATE, 
PTHREAD PROCESS SHARED 


返回 值 : 若 成 功 ， 


返回 0， 否则， 返回 错误 编号 


pthread_spin_lock (pthread spinlock 七 */ock); 


<pthread.h> 
返回 值 : 若 成 功 ， 


返回 0; 和 否则， 返回 错误 编号 


pthread_spin_trylock (pthread spinlock t *lock) ; 


<pthread.h> 
返回 值 : 若 成 功 ， 


返回 o: 否则， 返回 错误 编号 


pthread_spin_unlock (pthread_spinlock_t *lock) ; 


<pthread.h> 
返回 值 : FRIJ, 


pthread_testcancel (void); 
<pthread.h> 


*ptsname (int fd); 
<stdlib.h> 
返回 值 : 若 成 功 ， 


putc(int c, FILE *fp); 
<stdio.h> 
返回 值 : 若 成 功 ， 
putchar (int c); 
<stdio.h> 


返回 值 : 若 成 功 ， 


Putchar unlocked (int c); 
<stdio.h> 


返回 值 : 若 成 功 ， 


putc_unlocked(int c, FILE 
<stdio.h> 


返回 值 : 若 成 功 ， 


Putenv (char *str); 
<stdlib.h> 
返回 值 : 若 成 功 ， 


puts (const char *str); 
<stdio.h> 


返回 值 : 若 成 功 ， 


pwrite(int fd, const void 
<unistd.h> 


返回 值 : 若 成 功 ， 


raise(int signo); 
<signal.h> 


返回 值 : 若 成 功 ， 


read(int fd, void *buf, 
<unistd.h> 


返回 0， 和 否则， 返回 错误 编号 


返回 指向 PTY 从 设备 名 的 指针 ， AH, JBI] NULL 


返回 ce; 若 出 错 ， 返 回 EOF 


返回 c; 若 出 错 ， 返 回 EOF 





返回 c; 若 出 错 ， 返 回 EOF 
wD: 


返回 c; 若 出 错 ， 返 回 EOF 


返回 0; 若 出 错 ， 返 回 非 0 


返回 非 负 值 ; 若 出 错 ， 返 回 EOF 


*buf, size_t nbytes, off_t offset); 


返回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


返回 0; 着 出 错 ， 返 回 -1 


size_t nbytes); 


.417 


.417 


.418 


.418 


.418 


.453 


.723 


z152 


. 152 


444 


. 444 


212 


. 153 


. 18 


. 337 


zl 


struct 


dirent 


ssize t 


ssize t 


ssize t 


void 


ssize t 


ssize t 


ssize t 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 达 文 件 尾 端 ， 返 回 0; 若 出 错 ， 返 回 -1 


*readdir (DIR *dp); 
<dirent.h> 


返回 值 ， 若 成 功 ， 返 回 指针 ; 若 在 目录 尾 或 出 错 ， 返 回 NULL 


readlink(const char *restrict path, char *restrict buf, 
size_t bufsize); 
<unistd.h> 


返回 值 ， 若 成 功 ， 返 回 读 取 的 字 节 数 ; 车 出 错 ， 返 回 -1 


readlinkat (int fd, const char* restrict path, 
char *restrict buf, size_t bufsize); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 读 取 的 字 节 数 ;着 出错， 返回 -1 


readv(int fd, const struct iovec *iov, int iovent) ; 
<sys/uio.h> 


返回 值 : 若 成 功 ， 返 回 已 读 的 字 节 数 ， 若 出 错 ， 返 回 -1 


*realloc(void *ptr, size_t newsize); 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 


recv (int sockfd, void *buf, size_t nbytes, int flags); 
<sys/socket.h> 
flags: MSG_PEEK, MSG_OOB, MSG _WAITALL, 
MSG_CMSG _CLOEXEC (Linux 3.2.0) , 
MSG_DONTWAIT (FreeBSD 8.0, Linux 3.2.0, 
Solaris 10) , 
MSG_ERRQUEUE (Linux 3.2.0) , 
MSG_TRUNC (Linux 3.2.0) 
返回 值 : 数据 的 字 节 长 度 : 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 
若 出 错 ， 返 回 -1 


recvfrom(int sockfd, void *restrict buf, size_t len, int flags, 
struct sockaddr *restrict addr, 
socklen t *restrict addrlen) ; 
<sys/socket.h> 
flags: MSG PEEK, MSG _OOB, MSG WAITALL, 
MSG CMSG _CLOEXEC (Linux 3.2.0) , 
MSG _DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 
MSG _ERRQUEUE (Linux 3.2.0) , 
MSG_TRUNC (Linux 3.2.0) 


p. 130 


p. 123 


p. 123 


p. 521 


p. 207 


p. 612 


p. 613 


返回 值 : 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 


车 出 错 ， 返 回 -1 


recvmsg (int sockfd, struct msghdr *msg, int flags); 

<sys/socket.h> 

flags: MSG PEEK, MSG OOB, MSG WAITALL, 
MSG_CMSG_CLOEXEC (Linux 3.2.0) , 
MSG_DONTWAIT (FreeBSD 8.0, Linux 3.2.0, 

Solaris 10) , 

MSG ERRQUEUE (Linux 3.2.0) , 
MSG_TRUNC (Linux 3.2.0) 


p. 613 


返回 值 : 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 


若 出 错 ， 返 回 -1 
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int 


int 


void 


void 


int 


int 


void 


ci anes 


int 


int 


int 


int 


int 


int 


remove (const char *path); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


rename (const char *oldname, const char *newname) ; 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 0; AHH BE- 


renameat (int oldfd, const char *oldname, int newfd, 
const char *newname) ; 
<stdio.h> 
返回 值 : 若 成 功 ， 返 回 0; ARE, e- 
rewind (FILE *fp); 


<stdio.h> 


rewinddir (DIR *dp); 
<dirent.h> 


rmdir (const char *path) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


scanf(const char *restrict format, ...); 
<stdio.h> 


返回 值 ， WUT ATR, ABE Ee eS BIG 


seekdir(DIR *dp, long loc); 
<dirent.h> 


select (int maxfdpl, fd_set *restrict readfds, 
fd_set *restrict writefds, fd_set *restrict exceptfds, 
struct timeval *restrict tvptr); 
<sys/select.h> 


返回 值 : 准备 就 绪 的 描述 符 数 ， 若 超时 ， 返 回 0; 若 出 错 ， 


sem_close (sem t *sem); 
<semaphore.h> 
返回 值 : 若 成 功 ， 返 回 0; h, e- 
semctl (int semid, int semnum, int cmd, 
/* union semun arg */ ); 
<sys/sem.h> 
cmd: IPC STAT、 IPC SET, IPC_RMID, GETPID, 
GETNCNT, GETZCNT. GETVAL、 SETVAL, 
GETALL、 SETALL 
返回 值 : 《返回 值 取决 于 命令 ) ; 若 出 错 ， 返 回 -1 


sem_destroy(sem_t *sem) ; 
<semaphore.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


semget (key 七 key, int nsems, int flag); 
<sys/sem.h> 
flag: IPC_CREAT, IPC_EXCL 
返回 值 : 若 成 功 ， 返 回信 号 量 ID; 若 出 错 ， 返 回 -1 


sem getvalue (sem 七 *restrict sem, int *restrict valp); 
<semaphore.h> 


返回 值 : RIJ, E 0; A, E-I 


sem_init(sem t *sem, int pshared, unsigned int value); 
<semaphore.h> 


P 
文件 尾 端 ， 返 回 


返回 -1 


. 119 


= 149 


.119 


.158 


.130 


.130 


.162 


EOF 
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返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int semop (int semid, struct sembuf semoparray[], size_t nops); 
<sys/sem.h> p. 568 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 一 ! 
Sem 七 *sem_open(const char *name, int oflag, ... /* mode t mode, 
unsigned int value */ ); 
<semaphore.h> p. 579 


flag: IPC_CREAT, IPC_EXCL 
返回 值 : 若 成 功 ， 返 回 指向 信号 量 的 指针 ; 若 出 错 ， 返 回 SEM FAILED 


int sem post(sem t *sem); 
<semaphore.h> p. 582 


返回 值 : 若 成 功 ， 返回 0: 若 出 错 ， 返回 -1 


int sem_timedwait(sem t *restrict sem, 
const struct timespec *restrict tsptr); 
<semaphore.h> p. 581 
<time.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sem_trywait(sem_t *sem); 
<semaphore.h> p. 581 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int sem_unlink(const char *name) ; 
<semaphore.h> p. 580 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 一 1 


int sem wait(sem t *sem); 
<semaphore.h> p. 581 
返回 值 : 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 --] 


ssize t send(int sockfd, const void *buf, size_t nbytes, int flags); 
<sys/socket .h> p. 610 
flags: MSG EOR, MSG_OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 
MSG DONTROUTE (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8, Solaris 10) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8, Solaris 10) , 
MSG_EOF (FreeBSD 8.0, Mac OS X 10.6.8) , 
MSG_MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 


ssize t sendmsg (int sockfd, const struct msghdr *msg, int flags); 
<sys/socket.h> p. 611 
flags: MSG_EO, MSG_OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 
MSG DONTROUTE (FreeBSD 8.0. Linux 3.2.0. Mac OS X 10.6.8, 
Solaris 10) , 
MSG_DONTWAIT (FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8, 
Solaris 10) , 
MSG_EOF (FreeBSD 8.0, Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 字 节 数 : 若 出 错 ， 返 回 -1 


ssize_t sendto(int sockfd, const void *buf, size_t nbytes, int flags, 
const struct sockaddr *destaddr, socklen_t destlen) ; 
<sys/socket.h> p. 610 


void 


int 


int 


int 


int 


void 


int 


void 


int 


int 


void 


int 


int 


void 


void 


flags: MSG EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 


MSG _DONTROUTE (FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8. Solaris 10), 
MSG_DONTWAIT( FreeBSD 8.0, Linux 3.2.0,Mac OS X 10.6.8, Solaris 10), 


MSG_EOF (FreeBSD 8.0. Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ; 车 出 错 ， 返 回 --1 


setbuf (FILE *restrict fp, char *restrict buf); 
<stdio.h> 


setegid (gid t gid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setenv (const char *name, const char *value, int rewrite); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; A, BE- 


seteuid(uid t wid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setgid(gid_t gid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setgrent (void); 
<grp.h> 


setgroups (int groups, const gid t grouplist[]); 
<grp.h> /* Dang wx 
<unistd.h> /* FreeBSD, Mac OS X, and Solaris */ 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
sethostent (int sfayopen) ; 
<netdb.h> 


setjmp (jmp buf env); 
<setjmp.h> 


返回 值 : 若 直接 调用 ， 返 回 0; 车 从 longjmp 人 返回， 返回 非 0 


setlogmask (int maskpri) ; 
<syslog.h> 
返回 值 : 前 日 志 记录 优先 级 屏蔽 字 值 


setnetent (int stayopen) ; 
<netdb.h> 


setpgid(pid t pid, pid t pgid); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; AHH, BE- 


setpriority (int which, id t who, int value); 
<sys/resource.h> 
which: PRIO_PROCESS, PRIO_PGRP. PRIO USER 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 一 1 


setprotoent (int sfayopen) ; 
<netdb.h> 


setpwent (void) ; 
<pwd.h> 
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和 setregid(gid_t rgid, gid t egid); 


<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int setreuid(uid t ruid, uid t euid); 


<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


int setrlimit (int resource, 


<sys/resource.h> 

resource: RLIMIT CORE, RLIMIT CPU, 
RLIMIT DATA, RLIMIT FSIZE, 
RLIMIT_NOFILE, RLIMIT STACK, 
RLIMIT AS (FreeBSD 8.0, Linux 3.2.0, 


RLIMIT MEMLOCK (FreeBSD 8.0. Linux 3.2.0. 


void setservent (int sfayopen) ; 


<netdb.h> 


pid è setsid (void); 


<unistd.h> 


Solaris 10) , 


const struct rlimit *riptr); 


Mac OS X 10.6.8) , 
RLIMIT_MSGQUEUE (Linux 3.2.0) , 
RLIMIT_NICE (Linux 3.2.0) , 
RLIMIT_NPROC (FreeBSD 8.0, Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT_NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0, 
Mac OS X 10.6.8) , 
RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT_SIGPENDING (Linux 3.2.0) , 
RLIMIT_SWAP (FreeBSD 8.0) , 
RLIMIT VMEM (Solaris 10) 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


返回 值 : 若 成 功 ， 返 回 进程 组 ID; 若 出 错 ， 返 回 -1 


int setsockopt (int sockfd, int level, int option, const void *val, 


socklen t len); 


<sys/socket.h> 


返回 值 : ARH, E 0; 若 出 错 ， 返 回 -1 


void setspent (void); 


<shadow.h> 


平台 : Linux 3.2.0. Solaris 10 


int setuid (uid t wid); 


<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


int setvbuf (FILE *restrict jp, 


size_t size); 
<stdio.h> 


char *restrict buf, 


mode: _IOFBF. _IOLBF, _IONBF 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 非 0 


void *shmat (int shmid, const void *addr, int flag); 


<sys/shm.h> 


flag: SHM_RND, SHM RDONLY 
返回 值 : 若 成 功 ， 返 回 指向 共享 存储 段 的 指针 ; 若 出 错 ， 


int mode, 
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p. 599 
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int 


int 


int 
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int 


int 


int 


int 


int 


int 


int 


void 


void 


int 


shmctl (int shmid, int cmd, struct shmid ds *buf); 
<sys/shm.h> 
cmd: IPC_STAT, IPC_SET, IPC_RMID, 
SHM LOCK (Linux 3.2.0, Solaris 10) , 
SHM_UNLOCK (Linux 3.2.0. Solaris 10) 
返回 值 : 若 成 功 ， 返 回 O; 若 出 错 ， 返 回 -1 


shmdt (const void *addr) ; 


<sys/shm.h> 
返回 值 : 若 成 功 ， 返 回 O; 若 出 错 ， 返 回 -1 


shmget (key t key, size t size, int flag); 
<sys/shm.h> 
flag: IPC_CREAT, IPC EXCL 


返回 值 : 若 成 功 ， 返 回 非 负 共享 存储 ID; 若 出 错 ， 返 回 -1 


shutdown (int sockfd, int how); 
<sys/socket.h> 
how: SHUT_RD, SHUT WR、 SHUT RDWR 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
sig2str (int signo, char *str); 
<signal.h> 
返回 值 : 车 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 
平台 : Solaris 10 


Sigaction(int signo, const struct sigaction *restrict act, 


struct sigaction *restrict oact); 
<signal.h> 


返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


sigaddset (sigset 七 *sef, int signo); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sigdelset(sigset_t *set, int signo); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sigemptyset (sigset_t *set); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sigfillset(sigset_t *sef) ; 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


Sigismember (const sigset_t *set, int signo); 
<signal.h> 


返回 值 : 若 真 ， 返 回 1; 若 假 ， 返 回 0; 若 出 错 ， 返 回 一 1 


siglongjmp(sigjmp_buf env, int val); 
<setjmp.h> 


此 函数 不 返回 


(*signal (int signo, void (*func) (int))) (int); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 以 前 的 信号 处 理 配 置 ; 若 出 错 ， 返 回 STG ERR 


Sigpending(sigset_t *sef) 7 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
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sigprocmask(int how, const sigset_t *restrict set, 
sigset_t *restrict oset); 
<signal.h> p. 346 
how: SIG BLOCK, SIG UNBLOCK, SIG_SETMASK 
返回 值 : 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 一 1 


sigqueue (pid t pid, int signo, const union sigval value) 
<signal.h> p. 376 
返回 值 : 车 成 功 ， 返回 0; 若 出 错 ， 返回 一 1 


sigsetjmp (sigjmp buf env, int savemask) ; 
<setjmp.h> p. 356 
返回 值 : 若 直 接 调 用 ， 返 回 0; 若 从 siglongjmp 调用 返回 ， 返 回 非 0 值 


sigsuspend (const sigset_t *sigmask) ; 
<signal.h> p. 359 
返回 值 : -1, errno 设置 为 EINTR 


sigwait (const sigset_t *restrict set, int *restrict signop); 
<signal.h> p. 454 
返回 值 : 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


sleep(unsigned int seconds) ; 
<unistd.h> p. 373 
返回 值 : 0 或 未 休眠 的 秒 数 
snprintf (char *restrict buf, size t n, 
const char *restrict format, ...); 


<stdio.h> p. 159 
返回 值 : 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


sockatmark (int sockfd) ; 
<sys/socket.h> p. 626 
返回 值 : 若 在 标记 处 ， 返 回 1; 若 没 在 标记 处 ， 返 回 0: 若 出 错 ， 返 回 -!1 


socket (int domain, int type, int protocol) ; 
<sys/socket.h> p. 590 
type: SOCK_STREAM. SOCK_DGRAM. SOCK_SEQPACKET 
返回 值 : 若 成 功 ， 返 回 文件 〈 套 接 字 ) 描述 符 ; 若 出 错 ， 返 回 -1 


socketpair(int domain, int type, int protocol, int sockfd[2]); 
<sys/socket .h> p. 630 
type: SOCK_STREAM., SOCK_DGRAM, SOCK_SEQPACKET 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


sprintf (char *restrict buf, const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 车 成 功 ， 返 回 存 入 数组 的 字符 数 ; 若 编码 出 错 ， 返 回 负 值 


sscanf (const char *restrict buf, 
const char *restrict format, ...); 
<stdio.h> p. 162 
返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


stat(const char *restrict path, struct stat *restrict buf); 
<sys/stat.h> p. 93 
返回 值 : FRH, Beo FR eE- 


str2sig (const char *str, int *signop); 
<signal.h> p. 380 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -! 


char 


size t 


size_t 


char 


char 


int 


int 


void 


long 


平台 : Solaris 10 


*strerror (int errnum) ; 


<string.h> 


返回 值 : 指向 消息 字符 串 的 指针 


strftime (char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr); 
<time.h> 


返回 值 : 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 否则， 返回 0 


strftime_l(char *restrict buf, size_t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr, locale_t locale); 
<time.h> 


返回 值 : 着 有 空间 ， 返 回 存 入 数组 的 字符 数 ; 和 否则， 返回 0 


*strptime (const char *restrict buf, const char *restrict format, 
struct tm *restrict ¢mptr); 
<time.h> 


返回 值 : 指向 上 次 解析 的 字符 的 下 一 个 字符 的 指针 ;和 否则， 返回 NULL 


*strsignal (int signo); 
<string.h> 


返回 值 : 说 明 该 信号 字符 串 的 指针 


symlink (const char *actualpath, const char *sympath) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


symlinkat(const char *actualpath, int fd, const char *sympath) ; 
<unistd.h> 


返回 值 : 车 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1! 


sync (void); 
<unistd.h> 


sysconf (int name) ; 

<unistd.h> 

name: _SC_ARG MAX, _SC_ASYNCHRONOUS_IO, 
_SC_ATEXIT_MAX, _SC_ BARRIERS, 
_SC_CHILD_ MAX, _SC_CLK_TCK, 
_SC_CLOCK_SELECTION. _SC COLL WEIGHTS MAX, 
_SC_DELAYTIMER MAX. _SC_HOST NAME MAX, 
_SC_TIOV_MAX, _SC_JOB_ CONTROL, 
_SC_LINE MAX. _SC_LOGIN NAME MAX, 
_SC_MAPPED FILED, _SC MEMORY PROTECTION, 
_SC_NGROUPS_MAX, _SC_OPEN_MAX, 
_SC_PAGESIZE. _SC PAGE SIZE、 
_SC READER WRITER LOCKS.、 
_SC_REALTIME SIGNALS, _SC RE DUP MAX、 
_SC_RTSIG MAX. _SC_SAVED_IDS, 
_SC_SEMAPHORES. _SC_SEM NSEMS MAX, 
_SC_SEM_VALUE_MAX. _SC_SHELL,. 
_SC_STGQUEUE MAX, _SC_SPIN_LOCKS, 
SC_STREAM MAX. _SC_SYMLOOP_MAX, 
_SC_THREAD SAFE FUNCTIONS. 
_SC_THREADS, _SC TIMER MAX、 
_SC_TIMERS. _SC_TTY_NAME_MAX, 
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_SC XOPEN CRYPT、 _SC XOPEN REALTIME、 
_SC XOPEN REALTIME THREADS, _SC_XOPEN_SHM 


_SC_XOPEN_VERSION 
返回 值 : 若 成 功 ， 返 回 相 应 值 ， 若 出 错 ， 返 回 -1 


syslog (int priority, char *format, ...); 
<syslog.h> 


system(const char *cmdstring) ; 
<stdlib.h> 
返回 值 : shell 的 终端 状态 


tedrain(int fd); 
<termios.h> 
返回 值 : FRH, Be o 若 出 错 ， 返 回 -1 
tcflow (int fd, int action); 
<termios.h> 
action: TCOOFF、 TCOON, TCIOFF. TCION 
返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 --1 


tcflush(int fd, int queue) ; 
<termios.h> 
queue: TCIFLUSH, TCOFLUSH, TCIOFLUSH 
返回 值 : 若 成 功 ， 返 回 0; 若 出错 ， 返 回 -1 


tegetattr(int fd, struct termios *fermptr) ; 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0; ht, E- 


tcgetpgrp (int fd); 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 前 台 进 程 组 ID; 若 出 错 ， 返 回 -1 


tegetsid(int fä); 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -! 


tcsendbreak (int fd, int duration) ; 
<termios.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcsetattr (int fd, int opt, const struct termios *fermptr) ; 


<termios.h> 

opt: TCSANOW. TCSADRAIN, TCSAFLUSH 

返回 值 : 若 成 功 ， 返 回 0; Fh, E-I 
tcsetpgrp(int fd, pid t pgrpid); 


<unistd.h> 


返回 值 : FRY, BE 0; 若 出 错 ， 返 回 -1 


telldir(DIR *dp); 
<dirent.h> 


返回 值 : 与 dp 关联 的 目录 中 的 当前 位 置 


time (time 七 *calptr) ; 
<time.h> 


返回 值 : 若 成 功 ， 返 回 时 间 值 ， 若 出 错 ， 返 回 一 1 


times (struct tms *buf); 
<sys/times.h> 


返回 值 : 若 成 功 ， 经 过 的 墙 上 时 钟 时 间 ; 若 出 错 ， 返 回 -1 
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. 683 
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1693 


. 683 


. 298 
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char 


int 


char 
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int 


int 


int 


int 


int 


*tmpfile (void); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 文 件 指针 ; 若 出 错 ， 返 回 NULL 


*tmpnam(char *ptr) ; 
<stdio.h> 


返回 值 : 指向 唯一 路 径 名 的 指针 ; 若 出 错 ， 返 回 NULL 


truncate (const char *path, off_t length) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*ttyname (int fd) ; 
<unistd.h> 


返回 值 : 指向 终端 路 径 名 的 指针 ; 若 出 错 ， 返 回 NULL 


umask (mode_t cmask) ; 
<sys/stat.h> 


返回 值 : 之 前 的 文件 模式 创建 屏蔽 字 


uname (struct utsname *name) 7 
<sys/utsname.h> 


返回 值 : 若 成 功 ， 返 回 非 负 值 ; 若 出 错 ， 返 回 -1 


ungetc(int c, FILE *fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


unlink (const char *path) ; 
<unistd.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unlinkat (int fd, const char *path, int flag); 
<unistd.h> 
flag: AT_REMOVEDIR 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unlockpt (int fd); 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


unsetenv (const char *name) ; 
<stdlib.h> 
返回 值 : 若 成 功 ， 返 回 0: ABE, Be- 


utimensat(int fd, const char *path, 
const struct timespec ftimes[2], int flag); 
<sys/stat.h> 
flag: AT_SYMLINK_NOFOLLOW 
返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 





utimes (const char *path, const struct timeval fimes[2]); 


<sys/time.h> 


返回 值 : ÆR, E 0; 若 出 错 ， 返 回 =1 


vdprintf (int fd, const char *restrict format, va_list arg); 


<stdarg.h> 
<stdio.h> 


返回 值 : 车 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


vfprintf (FILE *restrict fp, const char *restrict format, 


va_list arg); 
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int 


int 


int 


int 


int 


void 


pid_t 


int 


pid t 


pid t 


<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回答 出 字符 数 : 若 输 出 出 错 ， 返 回 负 值 


vfscanf (FILE *restrict fp, const char *restrict format, va_list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vprintf (const char *restrict format, va_list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 和 输出 字符 数 : 若 输出 出 错 ， 返 回 负 值 


vscanf (const char *restrict format, va_list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsnprintf (char *restrict buf, size t n, 
const char *restrict format, va_list arg); 
<stdarg.h> p- 161 
<stdio.h> 


返回 值 : 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ; 若 编码 出 错 ， 返 回 负 值 


vsprintf(char *restrict buf, const char *restrict format, 
va_list arg); 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 存 入 数组 的 字符 数 : 若 编码 出 错 ， 返 回 负 值 


vsscanf(const char *restrict buf, const char *restrict format, 
va_list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 : 若 输 入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 BOF 


vsyslog(int priority, const char *format, va_list arg); 
<syslog.h> p. 472 
<stdarg.h> 
fi: FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8. Solaris 10 


wait(int *statloc) ; 
<sys/wait.h> p. 238 
返回 值 ， 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 


waitid(idtype t idtype, id t id, siginfo_t *infop, int options); 
<sys/wait.h> p. 244 
idtype: P_PID, P_PGID, P_ALL 
options: WCONTINUED. WEXITED. WNOHANG. WNOWAIT. WSTOPPED 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


台 : Linux 3.2.0、Solaris 10 


waitpid(pid t pid, int *statloc, int options) ; 
<sys/wait.h> p. 238 
options: WCONTINUED, WNOHANG, WUNTRACED 
返回 值 : 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 


Wait3 (int *statloc, int options, struct rusage *rusage) ; 
<sys/types.h> p. 245 
<sys/wait.h> 


pid t 


ssize t 


ssize t 


<sys/time, h> 

<sys/resource.h> 

options: WNOHANG, WUNTRACED 

返回 值 ,大 成 功 ， 返 回 进程 DD， 者 出 错 ， 返 回 0 或 -1 

FA: FreeBSD 8.0, Linux 3.2.0、 Mac OS X 10.6.8、Solaris 10 


wait4 (pid t pid, int *statloc, int options, struct rusage *rusage) ; 


<sys/types.h> 

<sys/wait.h> 

<sys/time.h> 

<sys/resource.h> 

options: WNOHANG, WUNTRACED 

PE: ARI WERE ID; ih EOR- 

EA FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8, Solaris 10 


write(int fd, const void *buf, size_t nbytes); 


<unistd.h> 


BAM: AAU, BASE US Aiii, RH- 


writev(int fd, const struct iovec *iov, int iovent) ; 


<sys/uio.h> 


Be: AR BAS APTS Fihi RE- 


p. 245 


p.n 


p.521 


B.1 本 书 使 用 的 头 文 件 

本 书 中 的 大 多 数 程序 都 包含 头 文件 apue.h， 如 图 B-1 所 示 。 其 中 定 
义 了 常量 (如 MAXLINE ) 和 我 们 自 编 函 数 的 原型 。 

大 多 数 程序 都 需要 包含 下 列 头 文件 : <stdio.h>、<stdlib.h> (其 中 有 
exit 函 数 原 型 ) 和 <unistd.h>〈 其 中 包含 所 有 标准 UNIX 函 数 的 原型 ) ， 
因此 头 文件 apue.h 目 动 包 含 了 这 些 系统 头 文件 ， 同 时 还 包含 了 
<string.h>。 这 样 就 减少 了 本 书 中 所 有 程序 的 长 度 。 








/* 

* Our own header, to be included before all standard system headers. 
ay 

#ifndef _APUE H 

#define _APUE_H 


#define _POSIX_C_SOURCE 200809L 


#if defined (SOLARIS) /* Solaris 10 */ 
#define XOPEN SOURCE 600 

telse 

#define XOPEN SOURCE 700 

fendif 


finclude <sys/types.h> /* some systems still require this */ 
include <sys/stat.h> 
#include <sys/termios.h> /* for winsize */ 





#if defined(MACOS) || !defined(TIOCGWINSZ) 





finclude <sys/ioctl.h> 

endif 

include <stdio.h> /* for convenience */ 
#include <stdlib.h> /* for convenience */ 
#include <stddef.h> /* for offsetof */ 
include <string.h> /* for convenience */ 
#include <unistd.h> /* for convenience */ 
#include <signal.h> /* for SIG ERR */ 





#define MAXLINE 4096 /* max line length */ 


/* 


* Default file access permissions for new files. 


ef 
#define FILE MODE (S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH) 
/* 
* Default permissions for new directories. 
iy 
#define DIR MODE (FILE_MODE | S_IXUSR | S_IXGRP | S_IXOTH) 
typedef void Sigfunc(int);/* for signal handlers */ 
#define min(a,b) tay < (Bb) ? Cay : (J) 
#define max(a,b) ((a) > (b) > (a) : (b)) 
/* 
* Prototypes for our own functions. 
wy 
char *path_alloc(size_t *); /* Figure 2.16 */ 
long open_max (void); /* Figure 2.17 */ 
int set_cloexec(int); /* Figure 13.9 */ 
void ele Fifi, AiE? 
void set_fl(int, int); /* Figure 3:12) */ 
void pr exit (int); /* Figure 8.5 */ 
void pr_mask(const char *); /* Figure 10.14 */ 
Sigfunc *signal_intr(int, Sigfunc *); /* Figure 10.19 */ 
void daemonize(const char *); /* Figure 13.1 */ 
void sleep us (unsigned int); /* Exercise 14.5 */ 
ssize t readn(int, void *, size t); /* Figure 14.24 */ 
ssize_t writen(int, const void *, size t); /* Figure 14.24 */ 
int fd_pipe(int *); /* Figure 17.2 */ 
int recv_fd(int, ssize t (*func) (int, 

const void *, size _t)); /* Figure 17.14 */ 
int send fd(int, int); /* Figure 17.13 */ 
int send_err(int, int, 

onst char *); /* Figure 17.12 */ 
int serv_listen(const char *); /* Figure 17.8 */ 
int serv_accept (int, uid t *); /* Figure 17.9 */ 
int cli_conn(const char *); /* Figure 17.10 */ 
int but _argei(chat *, ant (*fune) (int, 

char +y) /* Pigre 17.23 */ 
int tty_cbreak (int); /* Figure 18.20 */ 
int tty_raw (int) ; /* Figure 18.20 */ 
int tty_reset (int); /* Figure 18.20 */ 
void tty_atexit (void); /* Figure 18.20 */ 
struct termios *tty_termios (void) ; /* Figure 18.20 */ 


int ptym_open(char *, int); /* Figure 19.9: */ 


int ptys_open(char *); /* Figure 19.9 */ 
#ifdef TIOCGWINSZ 


pid_t pty_fork(int *, char *, int, const struct termios *, 

const struct winsize *); /* Figure 19.10 */ 
#fendif 
int lock_reg(int, int, int, off_t, int, off_t); /* Figure 14.5 */ 


#define read_lock(fd, offset, whence, len) \ 

lock_reg((fd), F_SETLK, F_RDLCK, (offset), (whence), (len)) 
#define readw_lock(fd, offset, whence, len) \ 

lock_reg((fd), F_SETLKW, F_RDLCK, (offset), (whence), (len)) 
#define write _lock(fd, offset, whence, len) \ 

lock_reg((fd), F_SETLK, F_WRLCK, (offset), (whence), (len) ) 
#define writew_lock(fd, offset, whence, len) \ 

lock_reg((fd), F_SETLKW, F_WRLCK, (offset), (whence), (len)) 
#define un_lock(fd, offset, whence, len) \ 

lock_reg((fd), F_SETLK, F_UNLCK, (offset), (whence), (len)) 


pid t lock_test(int, int, off_t, int, off_t); /* Figure 14.6 */ 


#define is read lockable(fd, offset, whence, len) \ 

(lock _test((fd), F_RDLCK, (offset), (whence), (len)) == 0) 
#define is write lockable(fd, offset, whence, len) \ 

(lock_test((fd), F WRLCK, (offset), (whence), (len)) == 0) 


void err_msg(const char *, ...)7 /* Appendix B */ 
void err_dump (const char *, ...) _attribute_ ((noreturn) ); 

void err _quit(const char *, ...) __attribute_ ((noreturn)); 

void err_cont(int, const char *, ...); 

void err exit(int, const char *, ...) _attribute_((noreturn)); 
void err ret(const char *, ...); 

void err_sys(const char *, ...) _attribute_ ((noreturn)); 

void log_msg (const char *, ...); /* Appendix B */ 
void log_open(const char *, int, int); 

void log_quit (const char *, ...) _attribute_((noreturn)); 

void log_ret (const char *, ...); 

void log_sys(const char *, ...) _attribute_((noreturn)); 

void log exit (int, const char *, ...) _attribute_((noreturn)); 
void TELL WAIT (void); /* parent/child from Section 8.9 */ 


void TELL_PARENT (pid_t) ; 
void TELL_CHILD(pid_t); 
void WAIT PARENT (void); 
void WAIT CHILD (void); 


#endif /* _APUE_H */ 





图 B-1 头 文件 apue.h 
程序 中 先 包 括 apue.h， 然 后 再 包括 一 般 系 统 头 文件 ， 这 样 就 使 我 们 
易于 做 到 下 列 各 点 : 可 以 先 定 义 一 些 在 此 后 包括 的 头 文 件 可 能 要 求 的 部 
T: 能 够 控制 头 文 件 被 包括 的 顺序 ， 能 够 重 定义 某 些 部 分 ， 而 这 正 是 为 
隐藏 两 个 系统 之 间 的 差别 而 需要 解决 的 。 
B.2 标准 出 错 例 程 
我 们 提供 了 两 套 出 错 函 数 ， 用 于 本 书 中 大 多 数 实例 以 处 理 各 种 出 错 
情况 。 一 套 以 err 开头， 并 癌 标 准 错误 输出 一 条 出 错 消 息 。 另 一 套 以 
log 开头， 用 于 守护 进程 〈 见 第 13 章 ) ， 它 们 多 半 没 有 控制 终端 。 
之 所 以 提供 我 们 上 自己 的 出 错 函 数 ， 是 为 了 能 够 编写 只 有 一 行 C 代 码 
的 出 错 处 理 程序 ， 例 如 : 
if (出 错 条 件 ) 
err_dump( 带 任意 参数 的 printf 格 式 ); 
这 样 就 不 再 需要 使 用 下 列 代 码 : 
if (出 错 条 件 ) { 
char buf[200]; 
sprintf(buf, 带 任意 参数 的 printf 格 式 ); 
perror(buf); 
abort(); 


} 

我 们 的 出 错 处 理 函 数 使 用 了 ISO C 的 变 长 参数 表 功 能 。 其 详细 说 明 
见 Kernighan 和 Ritchie[1988] 的 7.3 节 。 应 当 注 意 的 是 ， 这 个 ISO C 功 能 与 
早期 系统 〈 如 SVR3 和 4.3BSD) 提供 的 varargs 功 能 不 同 。 宏 的 名 字 相 
同 ， 但 更 改 了 某 些 宏 的 参数 。 

图 B-2 列 出 了 各 个 出 错 函 数 之 间 的 区 别 。 
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err exit 
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err cont 
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log_exit 
图 B-2 标准 出 错 函数 
图 B-3 包 括 了 输出 至 标准 错误 的 各 个 出 错 函 数 。 


finclude "apue ,hn 
finclude <errno.h> /* for definition of errno */ 
finclude <stdarg.h> /* ISO C variable aruments */ 


static void err doit (int, int, const char *, va_list); 


/* 


* Nonfatal error related to a system call. 


abort (); 
exit (1); 
return; 
exit (1); 
return; 
exit(1); 
return; 
return; 
exit (2) ; 
return; 
exit (2); 
exit (2); 





* Print a message and return. 
ia’ 
void 
err ret (const char *fmt, «s «) 
{ 


Wa List ap; 


va_start(ap, fmt); 
err_doit(1l, errno, fmt, ap); 
va_end (ap); 


/* 
* Fatal error related to a system call. 
* Print a message and terminate. 

*/ 

void 

erri sys (CONSE Ghan MEME; ac J 
{ 


va_list ap; 


va_start(ap, fmt); 
err_doit(1, errno, fmt, ap); 
va_end(ap); 

exit €1.)% 


/* 
* Nonfatal error unrelated to a system call. 
* Error code passed as explict parameter. 

* Print a message and return. 


ord 
void 
err cont (int error, const char “fmt, s -) 
{ 
va_list ap; 


va_start(ap, fmt); 
err gorrei; error, fmt, ap)? 
va_end (ap); 


Jk 
* Fatal error unrelated to a system call. 
* Error code passed as explict parameter. 
* Print a message and terminate. 


a A 
void 
err exit (int error, const char “fmt, «« x) 
{ 
va_list ap; 


va_start(ap, fmt); 
err_doit(1l, error, fmt, ap); 
va_end (ap); 


exit(l); 


/* 

* Fatal error related to a system call. 

* Print a message, dump core, and terminate. 
aA 

void 

err dump (const chaz “fmt, e se) 

{ 


va_list ap; 


va_start(ap, fmt); 

err_doit(l, errno, fmt, ap); 

va_end (ap); 

abort ()7 /* dump core and terminate */ 
exit(l1); /* shouldn't get here */ 


/* 
* Nonfatal error unrelated to a system call. 
* Print a message and return. 

d 

void 

err msqticonst: ehar FEME, mw od 
{ 

va_list ap; 


va start (apy fmt); 
erg dort (0, O;, fmt, Ap). 
va_end (ap); 


/* 
* Fatal error unrelated to a system call. 
* Print a message and terminate. 
ay 
void 
Grr Gube(eonst ‘Ghar Fit; s se 
{ 
va_list ap; 


va_start(ap, fmt); 

err doit(0; Oz Emt; apá 
va_end (ap); 

SR 


/* 

* Print a message and return to caller. 
* Caller specifies "errnoflag". 

ies? | 

static: void 


err _doit(int errnoflag, int error, const char *fmt, va_list ap) 


{ 


Char buf (MAXLINE] ， 


vsnprintf (buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf (buf+strlen (buf), MAXLINE-strlen(buf)-1, ": %s", 
strerror (error) } ; 
streat (buf, "\n"); 
fflush (stdout) ; /* in case stdout and stderr are the same */ 
fputs (buf, stderr); 
fflush (NULL) ; /* flushes all stdio output streams */ 


图 B-3 输出 至 标准 错误 的 出 错 函数 
图 B-4 包 括 了 各 log XXX ”出错 函数 。 知 进程 不 以 守护 进程 方式 运 
行 ， 那 么 调用 者 应 当 定 义 变量 log_ to_stderr， 并 将 其 设置 为 非 0 值 。 在 这 
种 情况 下 ， 出 错 消息 被 发 送 至 标准 错误 。 知 log to_stderr 标 志 为 0， 则 使 
用 syslog 设 施 〈 见 13.4 节 ) 。 








/* 
* Error routines for programs that can run as a daemon. 


*/ 


#include "apue.h" 

#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable arguments */ 
#include <syslog.h> 


static void log_doit(int, int, int, const char *, va_list ap); 


/* 

* Caller must define and set this: nonzero if 
* interactive, zero if daemon 

me 

extern int log to stderr; 


/* 
* Initialize syslog(), if running as daemon. 
=p 
void 
log_open(const char *ident, int option, int facility) 
{ 

if (log_to_stderr == 0) 

openlog(ident, option, facility); 


/* 

* Nonfatal error related to a system call. 

* Print a message with the system's errno value and return. 
mf 

void 

log_ret (const char *fmt, ...) 

{ 


va_list ap; 


va_start(ap, fmt); 


ELGG AOE; errno; LOG ERR, imt; ap) 
va_end (ap); 


J * 
* Fatal error related to a system call. 
* Print a message and terminate. 

E 

void 

Log i sovseitconss: char “Eimer, eae 

{ 


Te List ap; 


va start (ap, fn = 

Lög deat, Err: LOG_ERR, Em, ap) > 
vwa_end (ap) z 

cait Ca yen 


J* 
~*~ Nonfatal error unrelated to a system call. 
* Print a message and return. 
ey 
woid 
Log msg (Ense Shak “ent, mera 
{ 
Wet dast ap; 


Va Statetap, £m) = 
rög GAoertet, O; EOS ERR, me... apy. 
va_end (ap)? 


/* 
~*~ Fatal error unrelated to a system call. 
* Print a message and terminate. 


xy 
woid 
Log -Gquere const char: “Emit: se a) 
{ 
Wa base ap; 
Va Staritap, fmt) 2 
Log cagot (9; ay "BOG. BRE, Emt; ap). 
va_end(ap) > 
ex Le.(2) 2 
} 
/* 


x Fatal error related to a system call. 

* Error number passed as an explicit parameter. 
* Print a message and terminate. 

ia 

void 

bog ext Cink: error: const. haa “ame, Bas 


va_list ap; 


va_start (ap, fmt); 

log_doit(1, error, LOG_ERR, fmt, ap); 
va_end(ap) ; 

exit (2); 


/+ 

* Print a message and return to caller. 

* Caller specifies "errnoflag" and "priority". 

a 

static void 

log doit (int errnoflag, int error, int priority, const char *fmt, 
va_list ap) 


char buf [MAXLINE] ; 


vsnprintf (buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf (buft+strlen (buf), MAXLINE-strlen(buf)-1, ": $s", 
strerror (error) ); 
strcat (buf, "\n"); 
if (log_to_stderr) { 
fflush (stdout) ; 
fputs (buf, stderr); 
fflush (stderr); 
} else { 
syslog (priority, "ts", buf); 
} 




















图 B-4 用 于 守护 进程 的 出 错 函数 
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11 ”这 个 习题 利用 ls(1) 命 令 的 下 面 两 个 参数 : -i 打印 文件 或 目录 的 i 
节点 编号 《4.14 节 详细 讨论 了 i 节点 ) ; -d 仅 打印 目录 信息 ， 而 不 是 打印 
目录 中 所 有 文件 的 信息 。 

执行 下 列 命 令 : 

$ Is -ldi /etc/. /etc/.. -ji 要 求 打印 i 节 点 编号 

162561 drwxr-xr-x 66 root 4096 Feb 5 03:59 /etc/./ 

2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /etc/../ 

$ Is -ldi /. /.. .和 .. 的 i 节点 编号 均 为 2 

2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /../ 

12 ”UNIX 系统 是 多 道 程 序 或 多 任务 系统 ， 所 以 ， 在 图 1-6 所 示 程 序 
运行 的 同时 其 他 两 个 进程 也 在 运行 。 

1.3 因为 perror 的 msg 参 数 是 一 个 指针 ，perror 束 可 以 改变 msg 指 同 的 
字符 串 。 然 而 使 用 限定 符 const 限 制 了 perror 不 能 修改 msg 指 针 指 同 的 字 
符 串 。 而 对 于 strerror， 其 错误 号 参数 是 整数 类 型 ， 并 且 C 是 按 值 传递 所 
有 参数 ， 因 此 即使 strerror 函 数 想 修改 参数 的 值 也 修改 不 了 ， 也 就 没有 必 
要 使 用 const 属 性 。 《如果 对 C 中 函数 参数 的 处 理 不 是 很 清楚 ， 可 参见 
Kernighan 和 Ritchie[1988] 的 5.2 节 。 ) 

1.4 在 2038 年 。 将 time t 数 据 类 型 定 为 64 位 整 型 ， 就 可 以 解决 该 问题 
了 。 如 果 它 现在 是 32 位 整 型 ， 那 么 为 使 应 用 程序 正常 工作 ， 应 当 对 其 重 
编译 。 但 是 这 一 问题 还 有 更 粳 糙 之 处 。 

某 些 文件 系统 及 备份 介质 以 32 位 整 型 存放 时 间 。 对 于 这 些 同样 需要 
加 以 更 新 ， 但 又 需要 能 读 旧 的 格式 。 

1.5 大 约 248 天 。 
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2.1 下 面 是 FreeBSD 中 使 用 的 技术 。 在 头 文件 <machine/_types.h> 中 
定义 可 在 多 个 头 文件 中 出 现 的 基本 数据 类 型 。 例 如 : 

typedef int __int32_t; 

typedef unsigned int __uint32_t; 

#ifndef MACHINE TYPES H_ 











#define _MACHINE_TYPES_H_ 
typedef __uint32_t _ size_t; 


#endif /* MACHINE TYPES H */ 
a aN 以 定义 基本 数据 类 型 size t 的 头 文件 中 ， 包 含 下 面 的 语句 
FH 
#ifndef SIZE T DECLARED 
typedef _ size_t size_t; 
#define SIZE T DECLARED 
#endif 
这 样 ， 实 际 上 只 执行 一 次 size_t 的 typedef。 
2.3 如 果 OPEN_MAX 是 未 确定 的 或 大 得 出 奇 〈 即 等 于 
LONG MAX) ， 那 么 可 以 使 用 getrlimit 得 到 每 个 进程 的 最 大 打开 文件 描 
述 符 数 。 因 为 可 以 修改 对 每 个 进程 的 限制 ， 所 以 我 们 不 能 将 前 一 个 调用 
得 到 的 值 高 速 缓存 起 来 〈 它 可 能 已 被 更 改 ) ， 见 图 C-1。 











finclude "apue ,hn 
#include <limits.h> 
finclude <sys/resource. h> 


#define OPEN MAX GUESS 256 


long 

open_max (void) 

| 
long openmax; 
struct rlimit rl; 


1f ((openmax = sysconf(_SC_OPEN MAX)) < 0 || 
openmax == LONG MAX) { 

if (getrlimit (RLIMIT NOFILE, &rl) < 0) 
err sys("can't get file limit"); 

if (rl.rlim max == RLIM INFINITY) 
openmax = OPEN MAX GUESS; 

else 
openmax = rl.rlim max; 


return (openmax) ; 


图 C-1 标识 最 大 可 能 文件 描述 符 的 替换 方法 
第 3 章 
3.1 所 有 磁盘 LO 都 要 经 过 内 核 的 块 缓存 区 (也 称 为 内 核 的 缓冲 区 高 
速 绥 存 )。 唯 一 例外 的 是 对 原始 磁盘 设备 的 VO， 但 是 我 们 不 考虑 这 种 
情况 《Bach[1986] 的 第 3 章 讲 述 了 这 种 缓存 区 高 速 缓存 的 操作 ) BERR 





read 或 write 的 数据 都 要 被 内 核 缓 冲 ， 那 么 术语 “不 带 缓冲 的 MO” 指 的 是 在 
用 户 的 进程 中 对 这 两 个 函数 不 会 自动 缓冲 ， 每 次 read 或 write 就 要 进行 一 
次 系统 调用 。 

3.3 每 次 调用 open 函 数 就 分 配 一 个 新 的 文件 表 项 。 但 是 因为 两 次 打 
开 的 是 同一 个 文件 ， 则 两 个 文件 表 项 指向 相同 的 v 节 点 。 调 用 dup 引 用 已 
存在 的 文件 表 项 〈 此 处 指 fd1 的 文件 表 项 ) ， 见 图 C-2。 当 F_SETFD 作 用 
于 fd1 时 ， 只 影响 fd1 的 文件 描述 符 标 志 ; FE_SETFL 作 用 于 fd1 时 ， 则 影响 
fd1 及 fd2 指 向 的 文件 表 项 。 
























ae a XHK 
文件 状态 标志 
当前 文件 信 移 量 
tag o Vie 
标志 文件 指针 v 书 点 信息 
i cie did 
fd3: 人 
义 件 状态 标志 i 节点 信息 
SHC RIE 
viene P inode 

















图 C-2 open 和 dup 的 结果 

3.4 ”如果 fd 是 1， 执 行 dup2(fd，1) 后 返回 1， 但 没有 关闭 文件 描述 符 
1 (343.127) 。 调 用 3 次 dup2 后 ，3 个 描述 符 指 向 相同 的 文件 表 项 ， 所 
以 不 需要 关闭 描述 符 。 

如 果 fd 为 3， 调 用 3 次 dup2 后 ， 有 4 个 描述 符 指向 相同 的 文件 表 项 ， 
这 种 情况 下 就 需要 关闭 描述 符 3。 

3.5 因为 shell 从 左 到 右 处 理 命令 行 ， 所 以 

/a.out > outfile 2>&1 首 先 设置 标准 输出 到 outfile， 然 后 执行 dup 将 标 
准 输 出 复制 到 描述 符 2( 标 准 错误 ) 上 ， 其 结果 是 将 标准 输出 和 标准 错 
误 设 置 为 同一 个 的 文件 ， 即 描述 符 1 和 2 指向 同一 个 文件 表 项 。 而 对 于 


/一 








/a.out 2>&1 > outfile 

由 于 首先 执行 dup， 所 以 描述 符 2 成 为 终端 《假设 命令 是 交互 执行 
的 ) ， 标 准 输 出 重 定向 到 outfile。 结 果 是 摘 述 符 1 指 癌 outfile 的 文件 表 
项 ， 描 述 符 2 指 同 终端 的 文件 表 项 。 

3.6 ”这 种 情况 下 ， 仍 然 可 以 用 lseek 和 read 函 数 读 文件 中 任意 一 个 位 
置 的 内 容 。 但 是 write 函数 在 写 数据 之 前 会 自动 将 文件 偏 移 量 设 置 为 文件 
尾 ， 所 以 写 文 件 时 只 能 从 文件 尾 端 开 始 。 
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4.1 _ stat 函数 总 是 跟随 符号 链接 《〈 见 图 4-17) ， 所 以 该 程序 决 不 会 显 
示 文 件 类 型 是 “符号 链接 ”。 

例如 ， 正 如 本 书 正 文中 所 示 ，/dev/cdrom 是 /dev/sr0 的 一 个 符号 链 
接 ， 但 是 stat 函 数 的 结果 只 显示 /dewcdrom 是 一 个 块 特 殊 文 件 ， 而 不 报告 
它 是 一 个 符号 链接 。 奉 符号 链接 指 同 一 个 不 存在 的 文件 ，stat 会 出 错 返 
[A] 。 

4.2 将 关闭 该 文件 的 所 有 访问 权限 。 

$umask 777 

$ date > temp.foo 

$ Is -l temp.foo 











RTS 1 sar 29 Feb 5 14:06 temp.foo 

4.3 下 面 的 命令 显示 了 关闭 用 户 读 权限 时 所 发 生 的 情况 。 
$ data > foo 

$ chmod u-r foo 关闭 用 户 读 权限 

$ Is -l foo 验证 文件 的 权限 

--W-r--r-- 1 sar 29 Feb 5 14:21 foo 

$ cat foo 读 文 件 


cat: foo: Permission denied 
4.4 如 果 用 open 或 creat 创 建 已 经 存在 的 文件 ， 则 该 文件 的 访问 权限 
位 不 变 。 运 行 图 4-9 中 的 程序 可 以 验证 这 点 。 





$rm foo bar 删除 文件 

$ data > foo 创建 文件 

$data > bar 

$ chmod a-rfoo bar 关闭 所 有 的 读 权 限 
$ ls -] foo bar 验证 其 权限 
--W------- 1 sar 29 Feb 5 14:25 bar 
--W------- 1 sar 29 Feb 5 14:25 foo 
$ ./a.out 运行 图 4-9 程 序 


$ ls -] foo bar 检查 文件 的 权限 和 大 小 


--W------- 1 sar 0Feb 5 14:26 bar 

--W------- 1 sar 0Feb 5 14:26 foo 

可 以 看 出 访问 权限 没有 改变 ， 但 是 文件 被 截断 了 。 

45 目录 的 长 上 度 从 来 不 会 是 0， 因 为 它 总 是 包含 .和 .. 两 项 。 符 号 链接 
的 长 度 指 其 路 径 名 包含 的 字符 数 ， 由 于 路 径 名 中 至 少 有 一 个 字符 ， 所 以 
长 度 也 不 为 0。 

4.7 当 创 建新 的 core 文件 时 ， 内 核对 其 访问 权限 有 一 个 默认 设置 ， 
在 本 例 中 是 rw-r--r--。 这 一 默认 值 可 能 会 也 可 能 不 会 被 umask 的 值 修改 。 
shell 对 创建 的 重 定 同 的 新 文件 也 有 一 个 默认 的 访问 权限 ， 本 例 中 为 rw- 
rw-rw-， 这 个 值 总 是 被 当前 的 umask 修 改 ， 在 本 例 中 umask 为 02。 

4.8 不 能 使 用 du 的 原因 是 它 需 要 文件 名 ， 如 

du tempfile 

或 目录 名 ， 如 

du . 

只 有 当 unlink 函数 返回 时 才 释 放 tempfile 的 目录 项 ，du .命令 没有 
计算 仍然 被 tempfile 占 用 的 空间 。 本 例 中 只 能 使 用 df 命令 查看 文件 系统 中 
实际 可 用 的 空间 空 间 。 

4.9 ”如 果 被 删除 的 链接 不 是 该 文件 的 最 后 一 个 链接 ， 则 不 会 删除 该 
文件 。 此 时 ， 文 件 的 状态 更 改 时 间 被 更 新 。 但 是 ， 如 果 被 删除 的 链接 是 
最 后 一 个 链接 ， 则 该 文件 将 被 物理 删除 。 这 时 再 去 更 新 文件 的 状态 更 改 
ea 因为 包含 文件 所 有 信息 的 i 节点 将 会 随 着 文件 的 删除 

被 释放 。 

4.10 用 opendir 打 开 一 个 目录 后 ， 递 归 调 用 函数 dopath。 假 设 opendir 
使 用 一 个 文件 描述 符 ， 并 且 只 有 在 处 理 完 目录 后 才 调 用 closedir 释 放 描 述 
符 ， 这 就 意味 着 每 次 降 一 级 束 要 使 用 另外 一 个 描述 符 。 所 以 进程 可 打开 
的 最 大 摘 述 符 数 就 限制 了 我 们 可 以 壳 历 的 文件 系统 树 的 深度 。Single 
UNIX Specification 的 XSI 扩 展 中 说 明 的 ftw 允 许 调用 者 指定 使 用 的 描述 符 
数 ， 这 隐 含 着 可 以 关闭 摘 述 符 并 且 重 用 它们 。 

4.12 ”chroot 函数 被 因特网 文件 传输 协议 (Internet File Transfer 
Protocol, FTP) 程序 用 于 辅助 安全 性 。 系 统 中 没有 账户 的 用 户 (也 称 为 
匿名 FIP) 放 在 一 个 单独 的 目录 下 ， 利 用 chroot 将 此 目录 当 作 新 的 根 目 
录 ， 就 可 以 阻止 用 户 访问 此 目录 以 外 的 文件 。 

chroot 也 用 于 在 男 一 台 机 器 上 构造 一 个 文件 系统 层次 结构 的 副本 ， 
A 不 会 更 改 原 来 的 文件 系统 。 这 可 用 于 测试 新 软件 包 的 
EEG 

chroot 只 能 由 超级 用 户 执行 ， 一 旦 更 改 了 一 个 进程 的 根 ， 该 进程 及 
其 后 代 进 程 就 再 也 不 能 恢复 至 原先 的 根 。 





























4.13 首先 调用 stat 函数 取得 文件 的 3 个 时 间 值 ， 然 后 调用 utimes 设 
在 调用 utimes 时 我 们 不 希望 改变 的 值 应 当 是 stat 中 相应 的 

4.14 finger(1) 对 邮箱 调用 stat 函 数 ， 最 近 一 次 的 修改 时 间 是 上 一 次 接 
收 邮 件 的 时 间 ， 最 近 访 问 时 间 是 上 一 次 读 邮 件 的 时 间 。 

4.15 cpio 和 和 tar 存储 的 只 是 归档 文件 的 修改 时 间 Cst_mtim) 。 因 为 文 
件 归档 时 一 定 会 读 它 ， 所 以 该 文件 的 访问 时 间 对 应 于 创建 归档 文件 的 时 
间 ， 因 此 没有 存储 其 访问 时 间 。cpio 的 -a 选项 可 以 在 读 输入 文件 后 重新 
设置 该 文件 的 访问 时 间 ， 于 是 创建 归档 文件 不 改变 文件 的 访问 时 间 。 

《但 是 ， 重 置 文件 的 访问 时 间 确 实 改变 了 状态 更 改 时 间 。) 状态 更 改 时 
间 没 有 存储 在 文 挡 上 ， 因 为 即使 它 曾 被 归档 ， 在 抽取 时 也 不 能 设置 其 
值 。 (utimes ”函数 极其 相关 的 futimens 和 utimensta 函 数 可 以 更 改 的 仪 仅 
是 访问 时 间 和 修改 时 间 。) 

对 tar 来 说 ， 在 抽取 文件 时 ， 其 默认 方式 是 复原 归档 时 的 修改 时 间 
值 ， 但 是 tar 的 -m 选 项 则 将 修改 时 间 设 置 为 抽取 文件 时 的 时 间 ， 而 不 是 复 
原 归 档 时 的 修改 时 间 值 。 对 于 ”tar， 无 论 何 种 情况 ， 在 抽取 后 ， 文 件 的 
访问 时 间 均 是 抽取 文件 时 的 时 间 。 

另 一 方面 ，cpio 将 访问 时 间 和 修改 时 间 设 置 为 抽取 文件 时 的 时 间 。 
默认 情况 下 ， 它 并 不 试图 将 修改 时 间 设 置 为 归档 时 的 值 。cpio 的 -m 选 
项 将 文件 的 修改 时 间 和 访问 时 间 设 置 为 归档 时 的 值 。 

4.16 内 核对 目录 树 的 深度 没有 内 在 的 限制 ， 但 是 如 果 路 径 名 的 长 度 
超出 了 PATH_MAX， 则 有 许多 命令 会 失败 。 图 C-3 程 序 创建 了 一 个 深度 
为 1 000 的 目录 树 ， 每 一 级 目录 名 有 45 个 字符 。 

在 所 有 平台 上 我 们 都 能 构建 这 样 的 结构 ， 但 并 不 是 在 所 有 平台 上 都 
能 用 getcwd 得 到 第 1 000 级 目录 的 绝对 路 径 名 。 在 Mac OS X 10.6.8 中 ， 当 
到 达 长 路 径 的 目录 尾部 时 ，getcwd 就 不 再 成 功 了 。 在 FreeBSD 8.0、 
Linux 3.2.0 和 Solaris 10 中 ，getcwd 可 以 获得 路 径 名 ， 但 是 需要 多 次 调用 
realloc 得 到 一 个 足够 大 的 缓冲 区 。 在 Linux 3.2.0 上 运行 该 程序 后 得 到 : 

$ ./a.out 

getcwd failed, size = 4096: Numerical result out of range 

getcwd failed, size = 4196: Numerical result out of range 

ee 省 略 了 418 行 

getcwd failed, size = 45896: Numerical result out of range 

getcwd failed, size = 45996: Numerical result out of range 

length = 46004 


















































显示 46004 字 节 的 路 径 名 
然而 ， 不 能 用 cpio 归 档 此 目录 ， 因 为 文件 名 太 长 了 。 事 实 上 ，cpio 


在 所 有 4 种 平台 上 都 不 能 归档 此 目录 。 于 此 对 比 的 是 ， 在 FreeBSD 8.0、 
Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 可 以 用 tar 归 档 此 目录 。 然 而 ， 在 Linux 
3.2.0 上 ， 我 们 不 能 从 归档 文件 中 抽取 出 目录 的 层次 结构 。 





#include "apue,h" 
tinclude <fentl.h> 


#define DEPTH 1000 /* directory depth */ 

tdefine STARTDIR "/tmp" 

define NAME  “alonglonglonglonglonglonglonglonglonglongname" 
#define MAXSZ  (10*8192) 











int 

main (void) 

{ 
int Ls 
size t size; 
char *path; 


if (chdir(STARTDIR) < 0) 
err_sys("chdir error"); 


for (i = 0; i < DEPTH; i++) { 
if (mkdir (NAME, DIR MODE) < 0) 
err_sys("mkdir failed, i = %d", i); 
if (chdir(NAME) < 0) 
err_sys("chdir failed, i = %d", i); 


if (creat ("afile", FILE MODE) < 0) 
err_sys("creat error"); 


/* 
* The deep directory is created, with a file at the leaf. 
* Now let's try to obtain its pathname. 
me 
path = path_alloc(ésize); 
for (; 7) { 
if (getcwd(path, size) != NULL) { 
break; 
} else { 
err_ret("getcwd failed, size = %ld", (long)size); 
size += 100; 
if (size > MAXSZ) 
err_quit ("giving up"); 
if ((path = realloc(path, size)) == NULL) 
err_sys("realloc error"); 


} 
printf ("length = %ld\n%s\n", (long)strlen(path), path); 


exit (0); 





图 C-3 创建 深 目 录 树 

4.17 /dev 目 录 关 闭 了 一 般 用 户 的 写 访 问 权 限 ， 以 防止 普通 用 户 删 除 
目录 中 的 文件 名 。 这 就 意味 着 unlink 失 败 。 
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5.2 fgets 函 数 读 入 数据 ， 直 到 行 结束 或 缓冲 区 满 〈 当 然 会 留 出 一 个 
字 节 存放 终止 null 字 他 ) 。 

同样 ，fputs 只 负责 将 绥 冲 区 的 内 容 输 出 直到 过 到 一 个 null 字 市 ， 而 
并 不 考虑 缓冲 区 中 是 否 包含 换行 符 。 所 以 ， 如 果 将 MAXLINE 设 得 很 
小 ， 这 两 个 函数 仍然 会 正常 工作 ; 只 不 过 在 绥 冲 区 较 大 时 ， 函 数 被 执行 
的 次 数 要 多 于 MAXLINE 值 设置 得 较 大 的 时 候 。 

如 果 这 些 函 数 删 除 或 添加 换行 符 《〈 如 gets 和 puts 函 数 的 操作 ) ， 则 
必需 保证 对 于 最 长 的 行 ， 绥 冲 区 也 足够 大 。 

5.3 当 printf 没 有 输出 任何 字符 时 ， 如 printf(");， 函 数 调用 返回 0。 

5.4 这 是 一 个 比较 常见 的 错误 。getc 以 及 getchar 的 返回 值 是 int 类 型 ， 
而 不 是 char 类 型 。 

由 于 EOF 经 常 定义 为 -1， 那 么 如 果 系 统 使 用 的 是 有 符号 的 字符 类 
型 ， 程 序 还 可 以 正常 工作 。 但 如 果 使 用 的 是 无 符 写 字符 类 型 ， 那 么 返回 
的 EOF 被 保存 到 字符 c 后 将 不 再 是 -1， 所 以 ， 程 序 会 进入 死 循环 。 本 书 
说 明 的 4 种 平台 都 使 用 带 符号 字符 ， 所 以 实例 代码 都 能 工作 。 

5.5 ”使 用 方法 为 ， 先 调用 fflush 后 调用 fsync。fsync 所 使 用 的 参数 由 
fileno 函 数 获得 。 

如 果 不 调用 fflush， 所 有 的 数据 仍然 在 内 存 绥 冲 区 中 ， 此 时 调用 
fsync 将 没有 任何 效果 。 

5.6 ” 当 程 序 交 互 运行 时 ， 标 准 输入 和 标准 输出 均 为 行 缓冲 方式 。 
次 调用 fgets 时 标准 输出 设备 将 上 自动 冲洗 。 

5.7 基于 BSD 系 统 的 fmemopen 的 实现 如 图 C-4 所 示 。 























#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include <errno.h> 


/* 


* Our internal structure tracking a memory stream 


oN 

struct memstream 

{ 
char *buf; 
size t  rsize; 
size t  vsize; 
size_t curpos; 
int flags; 

}; 


/* flags */ 

#define MS READ 
#define MS WRITE 
#define MS _APPEND 
#define MS TRUNCATE 
#define MS MYBUF 


#ifndef MIN 


#define MIN(a, b) ((a) < (b) ? (a) 


#endif 


/* in-memory buffer */ 
/* real size of buffer */ 


/* virtual size of buffer */ 


/* current position in buffer */ 
/* see below */ 


0x01 
0x02 
0x04 
0x08 
0x10 


大 


Fani 


* 


大 


a 


* 


= 


* 


PR 


open for reading */ 

open for writing */ 

append to stream */ 

truncate the stream on open */ 
free buffer on close */ 


: (b)) 


static int mstream_read(void *, char *, int); 


static int mstream write(void *, const char *, int); 


static fpos_t mstream_seek(void *, fpos_t, int); 


static int mstream close (void *); 


static int type _to_flags(const char * restrict type); 


static off t find_end(char *buf, size_t len); 


FILE * 


fmemopen(void * restrict buf, size_t size, 


const char * restrict type) 


struct memstream *ms; 
PELE. “ip; 


E tsize == QO) í 
errno = EINVAL; 
return (NULL) ; 


Il 
ll 


if ((ms = malloc(sizeof (struct memstream) ) ) 
errno = ENOMEM; 
return (NULL); 


if ((ms->flags = type_to_flags(type)) == 0) { 
errno = EINVAL; 
free (ms) ; 
return (NULL); 


if (buf == NULL) { 
if ((ms->flags & (MS_READ|MS WRITE)) != 
(MS_READ|MS WRITE)) { 
errno = EINVAL; 
free (ms) ; 
return (NULL) ; 
} 
if ((ms->buf = malloc(size)) == NULL) { 
errno = ENOMEM; 
free (ms) > 
return (NULL); 
} 
ms->rsize = size; 
ms->flags |= MS_MYBUF; 
ms->curpos = 0; 
} else { 
ms->buf = buf; 
ms->rsize = size; 
if (ms->flags & MS APPEND) 


NULL) { 


ms->curpos = find_end(ms->buf, ms->rsize); 


else 
ms->curpos = 0; 
} 
if (ms->flags & MS APPEND) { 7s “ar 
ms->vsize = ms->curpos; 
} else if (ms->flags & MS_TRUNCATE) { f= we 
ms->vsize = 0; 
} else { f= Met 
ms->vsize = size; 
} 
fp = funopen(ms, mstream_read, mstream_write, 
mstream_seek, mstream_close) ; 
if (fp == NULL) { 
if (ms->flags & MS_MYBUF) 
free (ms—->buf) ; 
free (ms) ; 
} 
return(fp); 


mode */ 


mode */ 


mode */ 


static ant 
type _ to_flags (const 
{ 


const echar “cps 
int flags = O; 
for (cp = type; *cp != Of cpt++) f 
SsSwiteh (ep) -f 
Case, "2" s 
if (flags != O} 
return (0); /* error KA 
flags |= MS_READ; 
break; 
case ‘'w': 
LE ftlkags m= g) 
return (0); {* error */f 
flags |= MS _WRITE|MS_ TRUNCATE; 
break; 
case tas 
if (flags != 0O) 
return (0); /* error */ 
flags |= MS_APPEND; 
break; 
case T Yg 
if (flags == 0O) 
return (0); /* error */ 
flags |= MS_READ|MS_ WRITE; 
break; 
case MEE 
if (flags == 0) 
return 人 LE error “Ff 
break; 
default: 
return (0); A error *y 


} 
return (flags); 


static pEr t 
Einad-enad(char DUE; 


{ 


SEE SE. ore OF 


while (off < len) f{ 
if (buf[foff] == 0) 
break; 


Ooff++; 


char *__restrict type) 


size t len) 


} 
return (off); 


static int 
mstream read(void *cookie, char *buf, int len) 


{ 


int nx; 
struct memstream *ms = cookie; 
if (!(ms->flags & MS_READ)) { 


errno = EBADF; 
return (-1); 

} 

if (ms->curpos >= ms->vsize) 
return (0); 


/* can only read from curpos to vsize */ 
nr = MIN(len, ms->vsize 一 ms->curpos) 
memcpy (buf, ms->buf + ms-—>curpos, nr); 


` 


ms->curpos += nr; 
return (nr); 


Static int 
mstream write (void *cookie, const char *buf, int len) 
{ 

int nw, EE 

struct memstream *ms = cookie; 


if (!(ms->flags & (MS_APPEND|MS WRITE))) { 
errno = EBADF; 
return(-1); 


} 
if (ms->flags & MS _ APPEND) 


off = ms->vsize; 
else 
off = ms->curpos; 
nw = MIN(len, ms->rsize 一 off) 


“n 


memcpy (ms->buf + off, buf, nw) 
ms->curpos = off + nw; 
if (ms->curpos > ms->vsize) 4 
ms->vsize = ms->curpos; 
if (((ms->flags & (MS _READ|MS WRITE)) == 
(MS _READ|MS WRITE)) && (ms->vsize < ms->rsize) ) 
*(ms->buf + ms->vsize) = O; 
} 
if ((ms->flags & (MS_WRITE|MS_APPEND)) && 
!(ms->flags & MS _READ)) { 
if (ms->curpos < ms-—>rsize) 
*(ms->buf + ms->curpos) = 0 


` 


else 
*(ms-—Sbut + ms->rsize — 1) = 03 
} 


return (nw) > 


static fpos_t 
mstream seek (void *cookie, fpos t pos, int whence) 
{ 

int ort; 

struct memstream *ms = cookie; 


switch (whence) { 

case SEEK SET: 
off = pos; 
break; 

case SEEK END: 
off = ms->vsize + pos; 
break; 

case SEEK CUR: 
off = ms->curpos + pos; 
break; 

} 

if (off < 0 || off > ms->vsize) { 
errno = EINVAL; 
return -1; 

} 

ms->curpos = off; 

return (off); 


static int 
mstream close (void *cookie) 
{ 


struct memstream *ms = cookie; 


if (ms->flags & MS MYBUF) 
free (ms->buf) ; 

free (ms); 

return (0); 


图 C-4BSD 系 统 的 fmemopen 实 现 
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6.1 6.3 节 讲述 了 在 Linux 和 Solaris 系 统 中 访问 阴影 口令 文件 的 函数 。 
不 能 使 用 6.2 节 所 述 函 数 返 回 的 pw_passwd 字 段 值 与 加 密 口 令 相 比较 ， 
为 此 字段 不 是 加 密 的 口令 。 正 确 的 方法 是 使 用 阴影 口令 文件 中 对 应 用 户 
的 加 密 口 令 字 段 来 进行 比较 。 

在 FreeBSD 和 Mac OS ”XX 中 ,口令 文件 的 阴影 是 自动 建立 的 。 
FreeBSD 8.0 中 ， 仅 当 调 用 者 的 有 效用 户 ID 为 0 时 ，getpwnam 或 getpwuid 
函数 返回 的 passed 结 构 中 的 pw_passwd 字 段 包含 有 加 密 口令 。 在 Mac OS 
X 10.6.8 上 ， 加 密 口 令 不 能 通过 这 些 接口 访问 。 

6.2 在 Linux 3.2.0 和 Solaris 10 中 ， 图 C-5 程 序 输出 加 密 口 令 。 当 然 ， 
除非 有 超级 用 户 权 限 ， 和 否则 调用 getspnam 将 返回 EACCES 错 误 。 











finclude "apue ,hn 
#include <shadow.h> 


int 
main (void) /* Linux/Solaris version */ 
| 

struct spwd *ptr; 


1f ((ptr = getspnam("sar")) == NULL) 
err sys("getspnam error"); 
printf ("sp pwdp = %s\n", ptr->sp pwdp == NULL || 
ptr->sp pwdp(0) == 0 ? "(null)" : ptr->sp_pwdp); 
exit (0); 


图 C-5 在 Linux 和 Solaris 系 统 中 输出 加 密 口 令 


在 FreeBSD 8.0 中 ， 具 有 超级 用 户 权 限时 ， 图 C-6 程 序 将 输出 加 密 口 


令 ， 否 则 pw_passed 的 返回 值 为 星 号 (*) 。 在 Mac OS X 10.6.8 中 ， 不 管 
其 运行 时 的 用 户 权 限 是 什么 都 输出 星 号 。 


finclude "apue.h" 
finclude <pwd.h> 


int 
main (void) /* FreeBSD/Mac 0S X version */ 


| 


struct passwd ~ *ptr; 


1f ((ptr = getpwnam("sar")) == NULL) 
err sys("getpwnam error"); 
printf ("pw passwd = $s\n", ptr->pw_passwd == NULL || 
ptr->pw passwd[0] == 0 ? "(null)" : ptr->pw_passwd) ; 
exit (0) ; 


图 C-6 在 FreeBSD 和 Mac OS X 中 输出 加 密 口 令 
6.5 图 C-7 程 序 以 类 似 于 date 命 令 的 格式 输出 日 期 。 图 C-7 中 程序 的 运 
行 结 果 如 下 : 


#include "apue 
tinclude <time,h> 


int 

main (void) 

| 
time t caltime; 
struct tm  *tm; 
char line [MAXLINE] ; 


if ((caltime = time(NULL)) == -1) 
err sys("time error"); 

if ((tm = localtime(&caltime)) == NULL) 
err sys("localtime error"); 

if (strftime(line, MAXLINE, "sa $b Sd SX $2 Y\n", tm) == 0) 
err sys("stritime error"); 

fputs (line, stdout); 


exit (0) ， 
} 
图 C-7 以 date(1) 的 格式 输出 日 斯 和 时 间 
$ ./a.out 作者 的 默认 格式 是 美国 东部 
Wed Jul 25 22:58:32 EDT 2012 
$ TZ=US/Mountain ./a.out 美国 山地 时 间 
Wed Jul 25 20:58:32 MDT 2012 
$ TZ=Japan ./a.out 日 本 
Thu Jul 26 11:58:32 JST 2012 
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7.1 原因 在 于 printf 的 返回 值 〈 输 出 的 字符 数 ) 变 成 了 main 函数 的 
返回 值 。 为 了 验证 这 一 结论 ， 改 变 打印 字符 串 的 长 度 ， 然 后 运行 程序 ， 
查看 返回 值 是 否 与 新 的 字符 串 长 度 值 匹配 。 

当然 ， 并 不 是 所 有 的 系统 都 会 出 现 该 情况 。 还 要 注意 的 是 ， 如 采 在 











gcc 中 人 允许 ISO C 扩 展 的 编译 选项 ， 返 回 值 将 总 是 0， 这 是 标准 要 求 的 。 

7.2 ” 当 程 序 处 于 交互 运行 方式 时 ， 标 准 输出 通常 处 于 行 缓冲 方式 ， 
所 以 当 输 出 换行 符 时 ， 上 次 的 结果 才 被 真正 输出 。 如 果 标 准 输出 被 定 问 
到 一 个 文件 ， 而 标准 输出 处 于 全 缓冲 方式 ， 则 当 标 准 IO 清 理 操作 执行 
时 ， 结 果 才 真正 被 输出 。 

7.3 由 于 agrc 和 argv 的 副本 不 像 environ 一 样 保存 在 全 局 变量 中 ， 所 以 
在 大 多 数 UNIX 系 统 中 没有 其 他 办 法 。 

7.4 当 C 程 序 解 引用 一 个 空 指针 出 错时 ， 执 行 该 程序 的 进程 将 终止 。 
可 以 利用 这 种 方法 终止 进程 。 

7.5 定义 如 下 : 

typedef void Exitfunc(void); 

int atexit(Exitfunc *func); 

7.6 calloc 将 分 配 的 内 存 空间 初始 化 为 0。 但 是 ISO C 并 不 保证 0 值 与 
浮 点 0 或 空 roa 

7.7 “只 有 通过 exec 函 数 执行 一 个 程序 时 ， 才 会 分 配 堆 和 栈 〈 见 8.10 
ace ae 

7.8 可 执行 文件 Gaou) 包含 了 用 于 调试 core 文 件 的 符号 表 信息 。 用 
它们 的 
大 小 减 为 798 760 和 6 200 字 

7.9 ”没有 使 用 共 EE 可 执行 文件 的 大 部 分 都 被 标准 MO 库 所 占 


用 。 

7.10 ”这 上 段 代 码 不 正确 。 因 为 在 自动 变量 val 已 经 不 存在 之 后 ， 代 码 
还 通过 指针 引用 这 个 已 经 不 存在 的 自动 变量 。 上 自动 变量 val 在 复合 语句 
开始 的 左 花 括号 之 后 声明 了 ， 但 当 该 复合 语句 结束 时 ， 即 在 匹配 的 右 花 
HSZ, 自动 变量 就 个 存 在 了 ， 

81 为 了 仿真 子 进程 终止 时 关闭 标准 输出 的 行为 ， 在 调用 exit 之 前 加 
下 列 代 码 行 : 

fclose(stdout); 

WAS WER FAP JL 0 ed printf AEA 

i = printf("pid = %ld, glob = %d, var = %d\n", 

(long)getpid(), glob, var); 

sprintf(buf, "%d\n", i); 

write(STDOUT_FILENO, buf, strlen(buf)); 

还 需要 定义 变量 ji 和 buf。 

这 里 假设 子 进 程 调 用 exit 时 关闭 标准 IO 流 ， 但 不 关闭 文件 描述 符 
STDOUT_FILENO。 有 些 版 本 的 标准 WO 库 会 关闭 与 标准 输出 相关 联 的 



































文件 描述 符 从 而 引起 write 标准 输出 失败 。 在 这 种 情况 下 ， 调 用 dup 将 标 
准 输出 复制 到 另 一 个 描述 符 ，write 则 使 用 新 复制 的 文件 描述 符 。 
8.2 可 以 通过 图 C-8 程 序 来 说 明 这 个 问题 。 





include "apue ,hn 


static void fl(void), £2(void); 


int 

main (void) 

| 
f1(); 
£2(); 
exit (0); 


static void 
f1 (void) 
{ 
pidt pid; 


if ((pid = vfork()) < 0) 


err sys("vfork error"); 
/* child and parent both return */ 


static void 


£2 (void) 

| 
char buf [1000]; /* automatic variables */ 
int Ls 


for (i = 0; i < sizeof(buf); i++) 
buf [i] = 0; 


图 C-8 错误 使 用 vfork 的 例子 
当 函 数 代 调用 vfork 时 ， 父 进程 的 栈 指针 指向 全 函数 的 栈 巾 ， 见 图 C- 
9。Yvfork 使 得 子 进程 先 执行 然后 从 f1 返 回 ， 接 着 子 进程 调用 亿 ， 并 且 亿 的 
栈 帧 履 盖 了 fl 的 栈 帧 ， 在 包 中 子 进 程 将 自动 变量 buf 的 值 置 为 0， 即 将 栈 
中 的 1 000 个 字 节 的 值 都 置 为 0。 从 人 返回 后 子 进 程 调用 _exit， 这 时 栈 中 
main 栈 帧 以 下 的 内 容 已 经 被 人 2 修改 了 。 然 后 ， 父 进程 从 vfork 调 用 后 恢复 
继续 ， 并 从 代 返 回 。 返 回信 息 虽 然 第 常 保存 在 栈 中 ， 但 是 多 半 可 能 已 经 
被 子 进程 修改 了 。 对 于 这 个 例子 ， 父 进程 恢复 继续 执行 的 结果 要 依赖 于 
你 所 使 用 的 _ UNIX 系统 的 实现 特征 (如 返回 信息 保存 在 栈 帧 中 的 具体 位 
置 、 修 改动 态 变 量 时 乾 盖 了 哪些 信息 等 ) 。 通 常 的 结果 是 一 个 core 文 
件 ， 但 在 你 的 系统 中 ， 产 生 的 结果 可 能 不 同 。 
8.4 在 图 8-13 中 ， 我 们 先 让 父 进程 输出 ， 但 是 当 父 进程 输出 完毕 子 
进程 要 输出 时 ， 要 让 父 进程 终止 。 
是 父 进 程 先 终止 还 是 子 进程 先 执 行 输出 ， 要 依赖 于 内 核对 两 个 进程 
的 调度 〈 男 一 个 苋 争 条 件 ) 。 在 父 进程 终止 后 ，shell 会 开始 执行 下 一 个 
程序 ， 它 也 许 会 干扰 子 进程 的 和 输出。 为 了 避免 这 种 情况 ， 要 在 子 进程 完 
成 输出 后 才 终 止 父 进 程 。 用 下 面 的 语句 蔡 换 程序 中 fork 后 面 的 代码 。 
else if (pid == 0) { 
WAIT_PARENTO(); /* parent goes first */ 
charatatime("output from child\n"); 
TELL_PARENT(getppid()); /* tell parent we're done */ 




















} else { 
charatatime("output from parent\n"); 
TELL_CHILD(pid); /* tell child we're done */ 
WAIT_CHILD(Q); /* wait for child to finish */ 


} 


栈 的 后 部 





parenn 


图 C-9 调用 vfork 时 的 栈 帧 
由 于 只 有 终止 父 进程 才能 开始 下 一 个 程序 ， 而 该 程序 让 子 进 程 先 运 
行 ， 所 以 不 会 出 现 上 面 的 情况 。 
8.5 对 argv[2] 打 印 的 是 相同 的 值 (/home/sar/bin/testinterp) 。 原 因 是 
ere 吉 束 时 调用 了 execve， 并 且 与 直接 调用 execl 的 路 径 名 相 同 。 回 
Z 图 8-15。 
8.6 图 C-10 程 序 创建 了 一 个 僵 死 进程 。 


finclude "apue ,hn 


tifdef SOLARIS 

define PSCMD "ps -a -o pid, ppid,s, tty, comm" 
telse 

define PSCMD "ps -o pid,ppid, state, tty, command" 
tendif 


int 
main (void) 
| 
pidt pid; 


if ((pid = fork()) < 0) 
err_sys("fork error"); 

else if (pid == 0) /* child */ 
exit (0); 


/* parent */ 
sleep (4) ; 
system (PSCMD) ; 


exit (0); 


图 C-10 创建 一 个 僵 死 进程 并 用 ps 查看 其 状态 
执行 程序 结果 如 下 〈ps() 用 Z 表 示 僵 死 进程 ) : 
$ ./a.out 
PID PPIDSTT COMMAND 





2208 S pts/2 
2369 S pts/2 
7230 Z pts/2 
7230 S pts/2 
7232 R pts/2 


-bash 

./a.out 

[a.out] <defunct> 

sh -c ps -o pid,ppid,state,tty,command 
ps -o pid,ppid, state, tty,command 


9.1 


因为 init 是 登录 


shell 的 父 进 程 ， 当 登录 shell 终 止 时 它 收 到 


SIGCHLD 信 号 量 ， 所 以 init 进 程 知道 什么 时 候 终端 用 户 注销 ，。 
网 络 登录 没有 包含 init， 在 utmp 和 wtmp 文 件 中 的 登录 项 和 相应 的 注 
销 项 是 由 一 个 处 理 登录 并 检测 注销 的 进程 写 的 《本 例 中 为 telnetd) 。 
第 10 章 
10.1 当 程 序 第 一 次 接收 到 发 送 给 它 的 信号 时 就 终止 了 。 因 为 一 捕捉 


到 信号 ，pause 函 数 就 返回 。10.2 栈 帧 见 图 C-11。 


Balt ii 























处 理 处 理 longjmp 
SIGINT SIGALRM 局 
—— | 
main main main main 
的 楼 EB 的 栈 由 RB 
退回 
maln 
sleep2 sleep2 sleep2 
ABB hki heki 
sig_int sig int 
heki AN 
longjmp 
sig alrm 
的 栈 由 





图 C-11 longjmp 前 后 的 栈 帧 





在 sig_alrm 中 通过 longjmp 返 回 sleep2， 有 效 地 避免 了 继续 执行 
sig_int。 从 这 一 点 ，sleep2 返 回 main (回忆 图 10-8) 。 

10.4 在 第 一 次 调用 alarm 和 setjmp 之 间 义 有 一 次 竞争 条 件 。 如 果 进 
程 在 调用 alarm 和 setjmp 之 间 被 内 核 阻 塞 了 ， 曾 钟 时 间 超 过 后 就 调用 信 
号 处 理 程 序 ， 然 后 调用 longjmp。 

但 是 由 于 没有 调用 过 setjmp， 所 以 没有 设置 env_alrm 绥 冲 区 。 如 果 
a ian eee eet 则 说 明 longjmp 的 操作 是 未 

10.5 参见 Don Libes 的 论文 “Implementing Software Timers” (C users 
Journal, Vol.8,no.11,Nov. 1990) 中 的 例子 。 可 以 访问 http:// 
www.kohala.com/start/ libes.timers.txt 获 得 该 论文 的 电子 版 。 

10.7 “如 果 仅 仅 调用 _exit， 则 进程 终止 状态 不 能 表示 该 进程 是 由 于 
SIGABRT 信 和 号 而 终止 的 。 

10.8 如 果 信 号 是 由 其 他 用 户 的 进程 发 出 的 ， 进 程 必须 设置 用 户 ID 为 
根 或 者 是 接收 进程 的 所 有 者 ， 和 否则 Kill 不 能 执行 。 所 以 实际 用 户 ID 为 信 
号 的 接收 者 提供 了 更 多 的 信息 。 

10.10 “对 于 本 书 作者 所 用 的 一 个 系统 ， 每 60 一 90 分 钟 增加 一 秒 ， 这 
个 误 兰 是 因为 每 次 调用 sleep 都 要 调度 一 次 将 来 的 时 间 事 件 ， 但 是 由 于 
CPU 调度 ， 有 时 并 没有 在 事件 发 生 时 立即 被 唤醒 。 

另外 一 个 原因 是 进程 开始 运行 和 再 次 调用 sleep 都 需要 一 定量 的 时 
间 。 

cron 守 护 进 程 这 样 的 程序 每 分 钟 都 要 获取 当前 时 间 ， 它 首先 设置 一 
个 休眠 周期 ， 然 后 在 下 一 分 钟 开始 时 唤醒 。《“【 将 当前 时 间 转 换 成 本 地 时 
间 并 查看 tm_sec 值 。) 每 一 分 钟 ， 设 置 下 一 个 休眠 周期 ， 使 得 在 下 一 
分 钟 开 始 时 可 以 唤醒 。 大 多 数 调用 是 sleep(60)， 偶 尔 有 一 个 sleep(59) 用 
于 在 下 一 分 钟 同 步 。 但 是 ， 知 在 进程 中 花费 了 许多 时 间 执 行 命 令 或 者 系 
统 的 负载 重 、 调 度 慢 ， 这 时 休眠 值 可 能 远 小 于 60。 

10.11 在 Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 中 ， 从 来 没有 调用 
过 SIGXFSZ 的 信号 处 理 程序 ， 一 旦 文件 的 大 小 达到 1 024 时 ，write 就 返 
回 24。 

在 FreeBSD 8.0 中 ， 当 文件 大 小 已 达到 1 000 字 节 ， 在 下 一 次 准备 写 
100 字 节 时 调用 该 信号 处 理 程序 ，write 返 回 -1， 并 且 将 errno 设 置 为 
EFBIG (文件 太 大 ) à- 

在 所 有 4 种 平台 上 ， 如 果 在 当前 文件 偏 移 量 处 (文件 尾 端 ) 尝试 再 
一 次 ”write， 将 收 到 SIGXFSZ 信 号 ，write 将 失败 ， 返 回 -1， 并 将 errmo 设 
置 为 EFBIG。 

10.12 ”结果 依赖 于 标准 WO 库 的 实现 : fwrite 函 数 如 何 处理 一 个 被 中 





























bit HJ write . 

例如 ， 在 Linux ” ”3.2.0 上， 当 使 用 fwrite 函 数 写 一 个 大 的 缓冲 区 时 ， 
fwrite 以 相同 的 字 节 数 直 接 调 用 write。 在 write 系 统 调用 当中 ， 闸 钟 时 间 
到 ， 但 我 们 直到 写 结 束 才 看 到 信号 。 看 上 去 就 好 像 在 write 系统 调用 进行 





当中 内 核 阻 塞 了 信号。 
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ae 图 C-12 给 出 了 一 个 没有 使 用 目 动 变量 ， 而 采用 动态 内 存 分 配 的 
TTo 


tinclude "apue.h" 
finclude <pthread.h> 


struct foo { 
int a) by Ca di 


void 
printfoo(const char *s, const struct foo *fp) 
| 
f 
printf(" structure at Ox%lx\n", (unsigned long) fp) ; 
printf(" foo.a = d\n", fp->a); 
printf(" foo.b = $d\n", fp->b); 
t 
t 


uts(s, stdout); 


a 


printf(" foo.c = d\n", fp->c); 
f(" foo.d = $d\n", fp->d); 


























void * 
thr fnl (void *arg) 
| 


struct foo *fp; 


if ((fp = malloc (sizeof (struct foo))) == NULL) 
err sys ("can't allocate memory"); 


fp->a = 1; 
fp->b = 2; 
fp->c = 3; 
fp->d = 4; 


printfoo("thread:\n", fp); 
return((void *) fp); 


int 

main (void) 

{ 
int err; 
pthread_t tidl; 
struct foo *fp; 


err = pthread create(&tidl, NULL, thr fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread_join(tidl, (void *) &fp); 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printfoo("parent:\n", fp); 
exit (0); 

















图 C-12 线程 返回 值 的 正确 使 用 

11.2 要 改变 挂 起 作业 的 线程 ID， 必 须 持 有 写 模 式 下 的 读 写 锁 ， 防 止 
ID 在 改变 过 程 中 有 其 他 线程 在 搜索 该 列表 。 目 前 定义 该 接口 的 方式 存在 
的 问题 在 于 : 调用 job_find 找到 该 作业 以 及 调用 job_remove 从 列表 中 删 
除 该 作业 这 两 个 时 间 之 间作 业 ID 可 以 改动 。 这 个 问题 可 以 通过 在 job 结 
构 中 磐 入 引用 计数 和 互 斥 量 ， 然 后 让 job_find 增 加 引用 计数 的 方法 来 解 
决 。 这 样 修改 的 代码 就 可 以 避免 对 列表 中 非 零 引 用 计数 的 任何 作业 进 
行 ID 改动 的 情况 。 

11.3 首先 ， 列 表 是 由 读 写 锁 保 护 的 ， 但 条 件 变 量 需 要 互 斥 量 对 条 件 
进行 保护 。 其 次 ， 每 个 线程 等 待 满 足 的 条 件 应 该 是 有 某 个 作业 进行 处 理 
时 需要 的 条 件 ， 所 以 需要 创建 每 线程 数据 结构 来 表示 这 个 条 件 。 或 者 ， 
可 以 把 互 斥 量 和 条 件 变量 僚 入 到 queue 结 构 中 ， 但 这 意味 着 所 有 的 工作 
线程 将 等 竺 相同 的 条 件 。 如 果 有 很 多 工作 线程 存在 ， 当 唤醒 了 许多 线程 
但 又 没有 工作 可 做 时 ， 惑 可 能 出 现 尺 群 效应 问题 ， 最 后 导致 CPU 资源 的 
浪费 ， 并 且 增 加 了 锁 的 争夺 。 

11.4 这 根据 具体 情况 而 定 。 总 的 来 说 ， 两 种 情况 都 可 能 是 正确 的 ， 
但 每 一 种 方法 都 有 不 足 之 处 。 在 第 一 种 情况 下 ， 等 待 线程 会 被 安排 在 调 
用 pthread_cond_broadcast 之 后 运行 。 如 果 程 序 运行 在 多 处 理 器 上 ， 由 于 
还 持 有 互 斥 锁 Cpthread_cond_waitik FIFFA NM RED) ， 一 些 线程 就 会 
运行 而 且 马 上 阻塞 。 在 第 二 种 情况 下 ， 运 行 线程 可 以 在 第 3 步 和 第 4 步 
之 间 获 取 互 斥 锁 ， 然 后 使 条 件 失 效 ， 最 后 释放 互 斥 锁 。 接 着 ， 当 调用 
pthread_cond_broadcast 时 ， 条 件 不 再 为 真 ， 线 程 无 需 运 行 。 这 就 是 为 什 
么 唤醒 线程 必须 重新 检查 条 件 ， 不 能 仅仅 因为 pthread_cond_wait 返 回 束 
假定 条 件 就 为 真 。 
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12.1 就 像 人 们 首先 会 猜 到 的 ， 这 并 不 是 一 个 多 线程 问题 。 这 些 标准 
IO 例 程 事 实 上 是 线程 安全 的 。 我 们 调用 fork 时 ， 每 个 进程 获得 了 标准 
IO 数据 结构 的 一 份 副 本 。 程 序 运行 时 把 标准 输出 定 同 到 终端 时 ， 输 出 
是 行 缓冲 的 ， 所 以 每 次 打印 一 行 时 ， 标 准 IO 库 就 把 该 行 号 到 终端 上 。 
但 是 ， 如 果 把 标准 输出 重 定向 到 文件 的 话 ， 则 标准 输出 就 是 全 绥 冲 的 。 
当 绥 冲 区 满 或 者 进程 关闭 流 时 ， 输 出 才 会 写 到 文件 。 在 这 个 例子 中 ， 执 
行 fork 时 ， 组 冲 区 中 包含 了 还 未 写 的 几 个 打印 行 ， 所 以 当 父 进程 和 子 进 
程 最 终 冲 洗 绥 冲 区 中 的 副本 时 ， 最 初 的 复制 内 容 束 会 写 入 文件 。 

12.3 理论 上 来 讲 ， 如 果 在 信号 处 理 程序 运行 时 阻塞 所 有 的 信号 ， 那 
么 就 能 使 水 数 成 为 异步 信号 安全 的 。 问 题 是 我 们 并 不 能 知道 调用 的 某 个 
函数 可 能 并 没有 屏蔽 已 经 被 阻塞 的 信号 ， 这 样 通过 另 一 个 信号 处 理 程序 
可 能 会 使 该 函数 变 成 可 重 入 的 。 
















































































12.4 在 FreeBSD 8.0 上 ， 程 序 抛 出 core。 用 gdb 的 话 ， 可 以 看 到 程序 
初始 化 过 程 将 调用 线程 函数 ， 这 些 函 数 调用 getenv 找 到 环境 变量 
LIBPTHREAD_SPINLOOPS#ILIBPTHREAD YIELDLOOPS 的 值 。 然 
而 ， 我 们 的 线程 安全 版 本 的 getenv 回 调 pthread 库 函数 会 处 于 一 种 中 间 的 
不 一 致 状态 。 另 外 ， 线 程 初始 化 函数 会 调用 malloc， 并 在 malloc 中 调用 
getenv 来 查找 环境 变量 MALLOC_OPTIONS 的 值 。 

为 了 避 开 这 个 问题 ， 我 们 可 以 合理 假定 程序 启动 是 单线 程 的 ， 并 使 
用 一 个 标志 来 指示 线程 初始 化 已 经 通过 我 们 的 getenv 来 完成 了 。 但 这 个 
标志 为 假 时 ， 我 们 版 本 的 getenv 会 和 不 可 重 入 版 本 一 样 操作 (并且 避 人 免 
调用 任何 pthread 函 数 和 malloc) 。 然 后 我 们 提供 一 个 独立 的 初始 化 函数 
来 调用 pthread_once， 而 非 从 getenv 里 面 来 调用 它 。 这 就 要 求 在 调用 
getenv 之 前 程序 调用 我 们 的 初始 化 函数 。 这 就 解决 了 我 们 的 问题 ， 因 为 
只 有 程序 启动 初始 化 完成 后 才能 进行 。 当 程序 调用 了 我 们 的 初始 化 函数 
后 ， 这 个 版 本 的 getenv 就 是 线程 安全 的 。 

12.5 如 果 和 希望 在 一 个 程序 中 运行 另 一 个 程序 ， 还 需要 fork 〈 即 在 调 
用 exec 之 前 ) 。 

12.6 图 C-13 给 出 了 使 用 select 实 现 线程 安全 的 Sleep 函数 ， 延 迟 一 定 
数量 的 时 间 。 它 是 线程 安全 的 ， 因 为 它 并 不 使 用 任何 未 经 保护 的 全 局 或 
静态 数据 ， 并 且 只 调用 其 他 线程 安全 的 函数 。 











include <unistd.h> 
tinclude <time.h> 
finclude <sys/select .h> 


unsigned 
sleep (unsigned seconds) 
| 
int n; 
unsigned slept; 
time t start, end; 
struct timeval tv; 


tv,tv sec = seconds; 

tv, tv_usec = 0; 

time (&start) ; 

n= select (0, NULL, NULL, NULL, &tv); 
if (n == 0) 


return (0) ; 
time (&end) ; 
slept = end - start; 
if (slept >= seconds) 
return (0) ; 
return(seconds - slept); 


图 C-13 sleep 的 线程 安全 实现 





12.7 很 多 时 候 条 件 变量 的 实现 都 使 用 互 斥 锁 来 保护 它 的 内 部 结构 。 
由 于 这 是 实现 细节 ， 因 而 通常 是 被 隐藏 起 来 的 ， 所 以 在 fork 处 理 程序 中 
没有 可 移植 的 方法 获取 或 释放 锁 。 既 然 在 调用 fork 后 并 不 能 确定 条 件 变 
量 中 的 内 部 锁 状 态 ， 所 以 在 子 进程 中 使 用 条 件 变量 是 不 安全 的 。 
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13.1 如 果 进 程 调用 chroot， 它 就 不 能 打开 /dev/log。 解 决 的 办 法 是 ， 
守护 进程 在 调用 chroot 之 前 调用 选项 为 LOG_NDELAY 的 openlog。 它 打 
开 特 殊 设 备 文 件 CUNIX 域 数据 报 套 接 字 ) 并 生成 一 个 描述 符 ， 即 使 调 
用 了 chroot 之 后 ， 访 描述 符 仍 然 是 有 效 的 。 这 种 场景 在 诸如 ftpd〈 文 件 
传输 协议 守护 进程 ) 这 样 的 守护 进程 中 出 现 ， 为 了 安全 起 见 ， 专 门 调用 
了 chroot， 但 仍 需要 调用 syslog 来 对 出 错 条 件 记 录 日 志 。 

13.4 图 C-14 展 示 了 一 种 解决 方案 。 





finclude “apue.h" 


int 

main (void) 

| 
FILE *fp; 
char *p; 


daemonize ("getlog"); 
p = getlogin(); 
fp = fopen("/tmp/getlog.out", "w"); 
if (fp != NULL) { 
if (p == NULL) 
fprintf (fp, "no login name\n"); 





else 
fprintf (fp, "login name; %s\n", p); 
} 
exit (0); 


图 C-14 调用 daemonize 然 后 获得 登录 名 

其 结果 依赖 于 不 同 的 系统 实现 。daemonize 关 闭 所 有 打开 文件 描述 
符 ， 然 后 癌 /devnull 再 打开 前 3 个 。 这 意味 着 进程 不 再 有 控制 终端 ， 所 以 
getlogin 不 能 在 utmp 文 件 中 看 到 进程 的 登录 项 。 于 是 在 Linux 3.2.0 Fil 
Solaris 10 中 ， 我 们 发 现 守护 进程 没有 登录 名 。 

但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 登 录 名 是 由 进程 表 维 护 
的 ， 并 且 在 执行 fork 时 复制 。 也 就 是 说 ， 除 非 其 父 进程 没有 登录 名 《如 
系统 自 引 导 时 调用 init) ， 人 否则 进程 总 能 获得 其 登录 名 。 
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14.1 测试 程序 如 图 C-15 所 示 。 


#include "apue.h" 
#include <fcntl.h> 
#include <errno.h> 


void 

sigint (int signo) 
{ 

} 


int 

main (void) 

{ 
pid_t pidl, pid2, pid3; 
int fa; 


setbuf (stdout, NULL); 
signal_intr(SIGINT, sigint); 


/* 

* Create a file. 

urd 

if ((fd = open("lockfile", O_RDWR|O_CREAT, 0666)) < 0) 
err_sys("can't open/create lockfile"); 


/* 
* Read-lock the file. 
i 
if ((pidl = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pidl == 0) { PR Chala ty: 
if (lock_reg(fd, F_SETLK, F_RDLCK, 0, SEEK SET, 0) < 0) 
err_sys("child 1: can't read-lock file"); 
printf ("child 1: obtained read lock on file\n"); 


pause (); 
printf ("child 1: exit after pause\n"); 
exit (0); 
} else { /* parent */ 
sleep (2); 
} 
/* 
* Parent continues ... read-lock the file again. 
aif 


lf (pra? = Fork()) = @) { 
err_sys("fork failed"); 
} else if (pid2 == 0) { Al child */ 
if (lock_reg(fd, F_SETLK, F_RDLCK, 0, SEEK_SET, 0) < 0) 
err_sys("child 2: can't read-lock file"); 
printf("child 2: obtained read lock on file\n"); 
pause (); 


printf ("child 2: exit after pause\n"); 


exit (0); 
} else { /* parent */ 
sleep (2); 
} 
/* 
* Parent continues ... block while trying to write-lock 
* the file. 
tif 


if ((pid3 = fork()) < 0) { 
err_sys("fork failed"); 
} else if (pid3 == 0) { /* child */ 
if (lock_reg(fd, F_SETLK, F_WRLCK, 0, SEEK_SET, 0) < 0) 
printf ("child 3: can't set write lock: %s\n", 
strerror (errno) ); 
printf ("child 3 about to block in write-lock...\n"); 
if (lock_reg(fd, F_SETLKW, F_WRLCK, 0, SEEK_SET, 0) < 0) 
err_sys("child 3: can't write-lock file"); 
printf ("child 3 returned and got write lock????\n"); 
pause (); 
printf ("child 3: exit after pause\n") ; 
exit (0); 
} else { /* parent */ 
sleep (2); 


/* 
* See if a pending write lock will block the next 
* read-lock attempt. 
€J 
if (lock_reg(fd, F_SETLK, F_RDLCK, 0, SEEK_SET, 0) < 0) 
printf ("parent: can't set read lock: %s\n", 
strerror (errno) ); 
else 
printf ("parent: obtained additional read lock while" 
"write lock is pending\n") ; 
Prince ("killing CHILA bs woh 
kill (pidl, SIGINT); 
printf ("killing child 2....\n") + 
kill (pid2, SIGINT); 
printf ("killing child 3: ..\n"); 
kill (pid3, SIGINT); 
exit (0); 





图 C-15 判断 记录 锁 的 行为 

在 FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 记 录 锁 的 行为 是 
相同 的 ， 后 增加 的 读者 可 使 未 决 的 写 者 不 断 等 待 。 运 行 该 程序 得 到 

child 1: obtained read lock on file 

child 2: obtained read lock on file 

child 3: can't set write lock: Resource temporarily unavailable 

child 3 about to block in write-lock... 

parent: obtained additional read lock while write lock is pending 

killing child 1... 

child 1: exit after pause 

killing child 2... 

child 2: exit after pause 

killing child 3... 

child 3: can't write-lock file: Interrupted system call 

14.2 大 多 数 系统 将 数据 类 型 fd_set 定 义 为 只 包含 一 个 成 员 的 结构 ， 
该 成 员 为 一 个 长 整 型 数组 。 

数组 中 每 一 位 (bit〉 对 应 于 一 个 描述 符 。4 个 FD_ 宏 通过 开 、 关 或 
测试 指定 的 位 对 这 个 数组 进行 操作 。 

将 之 定义 为 一 个 包含 数组 的 结构 而 不 仅仅 是 一 个 数组 的 原因 是 : 通 
过 C 语言 的 赋值 语句 ， 可 以 使 fd_set 类 型 的 变量 相互 赋值 。 

14.3 大 多 数 系 统 允 许 用 户 在 包括 涉 文件 <sys/select.h> 前 定义 常量 
FD_SETSIZE。 例 如 ， 我 们 可 以 写 下 面 这 样 的 代码 来 定义 fd_set 数 据 类 
型 ， 使 其 可 以 包含 2 048 个 描述 符 : 

#define FD_SETSIZE 2048 

#include <sys/select.h> 

遗憾 的 是 ， 事 情 并 非 如 此 简单 。 为 了 在 现代 系统 使 用 该 技术 ， 我 们 
需要 做 以 下 几 件 事情 。 

(1) 在 包含 任何 头 文件 之 前 ， 我 们 需要 定义 哪 种 符号 来 防止 包含 
<Ssys/selecth> 。 一 些 系统 会 使 用 一 个 单独 的 符号 来 保护 fd_set 类 型 的 定 
义 ， 我 们 也 需要 如 此 定义 。 

例如 ， 在 FreeBSD 8.0 中 ， 我 们 需要 定义 _ SYS_SELECT _H 来 防止 
包含 <sys/select.h>， 定 义 _FD_SET 来 防止 包含 fd_set 数 据 类 型 的 定义 。 

(2) 有 时 ， 为 了 和 旧 应 用 程序 莱 容 ，<sys/types.h> 定 义 了 fd_set 的 
大 小 ， 所 以 我 们 必须 首先 包含 它 ， 然 后 去 掉 FD_SETSIZE 的 定义 。 注 
意 ， 一 些 系 统 用 _FD_SETSIZE 来 代替 。 

(3) 想 能 够 使 用 select 时 ， 我 们 需要 重新 定义 FD_SETSIZE (或 
_FD_SETSIZE) 来 最 大 化 文件 描述 符 的 数量 。 











(4) 我 们 需要 取消 定义 第 一 步 定 义 的 符号 。 
(5) 最 终 ， 我 们 能 够 包含 <sys/select.h>。 
在 运行 程序 之 前 ， 我 们 需要 配置 系统 允许 我 们 打开 所 需 的 文件 描述 
SCRE, 这 样 我 们 能 够 实际 利用 的 文件 描述 符 数 量 达 到 FD_SETSIZE 


ie 
14.4 下 面 列 出 了 功能 类 似 的 函数 。 





FD_ZERO Sigemptyset 


FD _SET Sigaddset 
FD CLR Sigdelset 
FD ISSET Sigismember 
没有 与 Sigfillset 对 应 的 FD_xxx 函 数 。 对 信号 量 集 来 次 ， 指 同 信 号 量 
集 的 指针 总 是 第 一 个 参数 ， 信 和 号 编号 是 第 二 个 参数 。 对 于 描述 符 来 说 ， 


描述 符 编 号 是 第 一 个 参数 ， 指 回 描 述 符 集 的 指针 是 第 二 个 参数 。 
14.5 利用 select 实 现 的 程序 见 图 C-16。 

















tinclude "apue.h" 
tinclude 《SYS/Select ,h> 


void 


sleep us(unsigned int nusecs) 


struct timeval tval; 


tval,tv sec = nusecs / 1000000; 
tval.tv_usec = nusecs % 1000000; 
select (0, NULL, NULL, NULL, &tval); 


图 C-16 用 select 实 现 sleep_ us 函数 
利用 pol 实 现 的 程序 见 图 C-17。 





#include <poll.h> 


void 
sleep us (unsigned int nusecs) 
| 
struct pollfd dummy; 
int timeout; 


if ((timeout = nusecs / 1000) <= 0) 
timeout = 1; 
poll(&dummy, 0, timeout); 


图 C-17 用 pol 实 现 sleep_us 函 数 

如 BSD usleep(3) 手 册页 中 所 说 明 的 ，usleep 使 用 nanosleep 函 数 ， 该 
函数 没有 与 调用 进程 设置 的 定时 需 交互 。 

14.6 不 行 。 我 们 可 以 使 TELL_WAIT 创 建 一 个 临时 文件 ， 其 中 1 个 字 
节 用 做 父 进程 的 锁 ， 另 外 1 个 字 节 用 做 子 进程 的 锁 。WAIT_CHILD 使 得 
父 进程 等 待 获 取 子 进程 字 节 上 的 锁 ， TELL_PARENT 使 得 子 进程 释放 子 
进程 字 节 上 的 锁 。 但 是 问题 在 于 ， 调 用 fork 会 释放 所 有 子 进 程 中 的 锁 ， 








使 得 子 进程 开始 运行 时 不 具有 任何 它 自 己 的 锁 。 


14.7 图 C-18 中 示 出 了 一 种 解决 方法 。 


#include "apue.h" 
#include <fcntl.h> 


int 

main (void) 

| 
int 1, i 
int fd[2]; 


if (pipe(fd) < 0) 
err sys("pipe error"); 
set_fl(fd[1], O_NONBLOCK) ; 


/* write 1 byte at a time until pipe is full */ 
for (n= 0; ; ntt) { 
if ((1 = write(fd[1], "a", 1)) (= 1) { 
printf ("write ret td, ", 1); 
break; 


printf ("pipe capacity = %d\n", n); 
exit (0); 





图 C-18 用 非 阻 塞 写 计算 管道 的 容量 
下 表 列 出 了 在 本 书 所 述 的 4 种 平台 上 计算 出 来 的 值 。 





管道 容量 〈 字 节 ) 


FreeBSD 8.0 65 536 
Linux 3.2.0 65 536 
Mac OS X 10.6.8 16 384 
Solaris 10 16 384 


这 些 值 可 能 与 对 应 的 PIPE_BUF 值 不 同 ， 其 原因 是 ，PIPE_BUF 被 
定义 为 可 被 自动 原子 地 写 至 一 个 管道 的 最 大 数据 量 。 这 里 ， 我 们 计算 的 
是 一 个 管道 独立 于 任何 原子 性 限制 可 保持 的 数据 量 。 

14.10 图 14-27 中 的 程序 是 人 否 更 新 输入 文件 的 上 一 次 访问 时 间 依 赖 
于 操作 系统 以 及 文件 所 属 的 文件 系统 的 类 型 。 在 所 有 4 种 平台 中 ， 当 文 
件 具 有 给 定 操作 系统 默认 的 文件 系统 类 型 ， 上 一 次 访问 时 间 束 会 更 新 。 
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15.1 ”如 果 管 道 的 写 端 总 是 不 关闭 ， 则 读者 就 决 不 会 看 到 文件 结束 
符 。 分 页 程序 就 会 一 直 阻 塞 在 读 标准 输入 。 

15.2 父 进 程 向 管道 写 完 最 后 一 行 以 后 就 终止 ， 当 父 进程 终止 时 管道 
的 读 端 自动 关闭 。 但 是 由 于 子 进程 〈 分 页 程序 ) 要 等 待 输出 的 页 ， 所 以 
父 进程 可 能 比 子 进程 领先 一 个 管道 缓冲 区 。 如 果 正 在 运行 的 是 一 个 可 对 
命令 行进 行 编 辑 的 交互 式 shell， 如 Korn ”shell， 那 么 当 父 进程 终止 时 ， 
shell 多 半 会 改变 终端 的 模式 并 打印 一 个 提示 。 这 个 无 疑 会 影响 已 经 对 终 
端 模式 进行 修改 的 分 页 程序 〈 由 于 大 部 分 分 页 程序 在 等 待 处 理 下 一 个 页 
面 时 将 终端 置 为 非 正规 模式 ) 。 

15.3 ”因为 执行 了 shell， 所 以 popen 返 回 一 个 文件 指针 。 但 是 shell 不 
能 执行 不 存在 的 命令 ， 因 此 在 标准 错误 上 打印 下 面 信息 后 终止 : 

sh: line 1: ./a.out: No such file or directory 

其 退出 状态 为 127( 该 值 取决 于 shell 的 类 型 ) 。pclose 返 回 该 命令 的 
终止 状态 ， 这 如 同 从 waitpid 返 回 一 样 。 

15.4 当 父 进程 终止 时 ， 用 shell 看 它 的 终止 状态 。 对 于 Bourne shell, 
Bourne-again shell 和 Korn shell， 所 用 的 命令 是 echo $?， 打 印 的 结果 是 
128 加 信号 编号 。 

15.5 首先 加 入 下 面 的 声明 : 

FILE *fpin, *fpout; 

然后 用 fdopen 关 联 管道 描述 符 和 标准 MO 流 ， 并 将 流 设 置 为 行 缓冲 
的 。 在 从 标准 输入 读 的 while 循 环 之 前 做 此 工作 。 


















































if ((fpin = fdopen(fd2[0], "r")) == NULL) 

err_sys("fdopen error"); 

if ((fpout = fdopen(fd1[1], "w")) == NULL) 

err_sys("fdopen error"); 

if (setvbuf(fpin, NULL, _IOLBF, 0) < 0) 

err_sys("setvbuf error"); 

if (setvbuf(fpout, NULL, _IOLBF, 0) < 0) 

err_sys("setvbuf error"); 

while 循 环 中 的 write 和 read 用 下 面 的 语句 代替 : 

if (fputs(line, fpout) == EOF) 
err_sys("fputs error to pipe"); 

if (fgets(line, MAXLINE, fpin) == NULL) { 

err_msg("child closed pipe"); 
break; 

} 

15.6 system 函数 调用 了 wait， 终 止 的 第 一 个 子 进程 是 由 popen 产 生 
的 。 S 所 以 它 将 再 次 调用 wait 并 一 直 阻 
塞 到 Sleep 完成。 然后 system 返 回 。 当 pclose 调 用 wait 时 ， 由 于 没有 子 进程 
可 等 竺 所 以 返回 出 错 ， 导 致 pclose 也 返回 出 错 。 

15.7 尽管 具体 细 布 会 随 平台 不 同 而 不 同 〈 见 图 C-19) ， 但 是 select 
表明 描述 符 是 可 读 的 。 调 用 read 读 完 所 有 的 数据 后 ， 返 回 0 就 表明 到 达 
了 文件 尾 端 。 但 是 对 于 pol 来 说 ， 寿 返回 POLLHUP 事件 ， 则 表明 也 许 
仍 有 数据 可 读 。 但 是 一 旦 读 完了 所 有 的 数据 ，read 就 返回 0 表明 到 达 了 











文件 尾 端 。 在 读 完了 所 有 的 数据 后 ，POLLIN 事 件 就 不 会 再 返回 了 ， 即 
使 需要 再 调用 一 次 read 以 接收 文件 尾 端 通知 〈 返 回 值 为 0) 。 


FreeBSD 8.0 | Linux 3.2.0 | Mac OS X 10.6.8 


aa 


laris 10 
EERME select | AT ia LAY select RWE 
道 写 端 关闭 时 读 端 上 的 poll HUP 
BERAMAN Sin LIN select | RW 
edi LE EmA poll | HUP 


图 C-19 select 和 poll 的 管道 行为 


图 C-19 中 所 示 的 条 件 包括 R CAE) 、W (可 写 ) 、E (异常 ) 、 
HUP ( 挂 断 》、ERR (错误 ) 和 INV (无 效 文件 描述 符 ) 。 对 于 引用 已 





让 
hy 























被 谈 者 关闭 的 管道 的 输出 描述 符 来 说 ，select 表 明 该 摘 述 符 是 可 写 的 。 
但 当 我 们 调用 write 时 ， 产 生 SIGPIPE 信 号 。 如 果 忽 上 略 该 信号 或 从 其 信号 
处 理 程 序 中 返回 ，write 就 会 失败 ， 将 error 设 置 成 EPIPE。 而 对 于 pol， 
具体 的 行为 则 会 根据 平台 的 不 同 而 不 同 。 

15.8 子 进程 同 标准 错误 写 的 内 容 同 样 也 会 在 父 进 程 的 标准 错误 中 出 
现 。 只 要 在 cmdstring 中 包含 shell 重 定 同 2>&1， 就 可 以 将 标准 错误 发 回 
给 父 进程 。 

15.9 popen 函 数 fork 一 个 子 进 程 ， 子 进程 执行 shell。 然 后 shell 再 调用 
fork， 最 后 由 shell 的 子 进程 执行 命令 串 。 当 cmdstring 终 止 时 ，shell 恰 好 
在 等 待 该 事件 。 然 后 shell 退 出 ， 而 这 一 事件 又 是 pclose 中 的 waitpid 所 等 
a 











15.10 解决 的 办 法 是 打开 Copen) FIFO 两 次 : 一 次 读 ; 一 次 写 。 我 
们 决 不 会 使 用 为 写 而 打开 的 描述 符 ， 但 是 使 该 描述 符 打 开 就 可 在 客户 数 
从 1 变 为 0 时 ， 阻 止 产生 文件 尾 端 。 打 开 FIFO 两 次 需要 注意 下 列 操作 方式 
(如 非 阻 寨 open 所 要 求 的 ) : 第 一 次 以 非 阻 塞 、 只 读 方 式 open;， 第 二 次 
以 阻塞、 只 写 方式 open。 “如果 先 用 非 阻塞 、 只 写 方式 open， 将 返回 错 
误 。) 然后 关闭 读 描述 符 的 非 阻 塞 属性 。 参 见 图 C-20 所 示 的 代码 。 





finclude "apue.h" 
tinclude <fcntl.h> 


fdefine FIFO "temp. fifo" 


int 
main (void) 
| 
int fdread, fdwrite; 


unlink (FIFO) ; 

1f (mkfifo(FIFO, FILE MODE) < 0) 
err_sys("mkfifo error"); 

if ((fdread = open(FIFO, O RDONLY | O_NONBLOCK)) < 0) 
err_sys("open error for reading"); 

if ((fdwrite = open(FIFO, O_WRONLY)) < 0) 
err_sys("open error for writing"); 

clr fl (fdread, 0 NONBLOCK) ; 

exit (0); 





























图 C-20 以 非 阻 塞 方式 打开 FIFO 进 行 读 、 写 操作 

15.11 ”随意 读 取现 行 队列 中 的 消息 会 干扰 客户 进程 -服务 器 进程 协 
议 ， 导 致 丢失 客户 进程 请 求 或 者 服务 器 进程 的 响应 。 只 要 知道 队列 的 标 
识 符 或 者 该 队列 允许 所 有 的 用 户 读 ， 进 程 就 可 以 读 队列 。 

15.13 ”由 于 服务 器 进程 和 各 客户 进程 可 能 会 将 段 连 接 到 不 同 的 地 
址 ， 所 以 在 共享 存储 段 中 决 不 会 存储 实际 物理 地 址 。 相 反 ， 当 在 共享 存 
储 段 中 建立 链表 时 ， 链 表 指 针 的 值 会 设置 为 共享 存储 段 内 男 一 对 象 的 偏 
移 量 。 偏 移 量 为 所 指 对 象 的 实际 地 址 减 去 共享 存储 段 的 起 始 地 址 。 

15.14 图 C-21 显 示 了 相关 的 事件 。 














父 进 程 的 i | 子 进 程 的 | AFE | update fe 
PNS 设置 成 | 设置 成 | ”返回 , 


rr | 
子 进程 先 运行 ， 然 后 被 阻塞 
父 进程 运行 


然后 父 进程 被 阻 守 
于 进程 继续 


然后 子 进程 被 阻塞 
父 进 程 继续 


然后 父 进程 被 阻 守 


然后 子 进程 被 阻 守 


父 进 程 继续 
图 C-21 图 15-33 中 父 进 程 和 子 进程 之 间 的 交替 过 程 





16.1 图 C-22 显 示 了 一 个 打印 系统 字 节 序 的 程序 。 


#include <stdio.h> 
tinclude <stdlib.h> 
include <inttypes.h> 


int 
main (void) 
| 
uint32 t i = 0x04030201; 
unsigned char  *cp = (unsigned char *)&i; 


1f (*cp == 1) 

printf ("little-endian\n"); 
else if (*cp == 4) 

printf ("big-endian\n") ; 
else 


printf ("who knows?\n"); 


exit (0); 
图 C-22 判断 系统 字 节 序 
16.3 对 于 我 们 将 要 监听 的 每 个 端点 ， 需 要 绑 定 到 一 个 合适 的 地 址 ， 
并 对 应 每 个 描述 符 在 fd_set 结 构 中 写 一 条 记录 。 然 后 使 用 select 等 待 从 多 


个 端点 来 的 连接 请 求 。 回 忆 16.4 节 ， 当 一 个 连接 请 求 达 到 时 ， 一 个 被 动 
的 端点 将 会 变 得 可 读 。 当 一 个 连接 请 求 真 的 到 达 时 ， 我 们 接受 该 请 求 ， 
并 如 以 前 一 样 处 理 。 

16.5 在 main 过 程 中 ， 通 过 调用 我 们 的 signal 函 数 〈 见 图 10-18) 来 捕 
捉 SIGCHLD， 该 函数 将 使 用 sigaction 来 安装 处 理 程序 指定 可 重启 的 系统 
调用 选项 。 下 一 步 ， 从 serve 函 数 中 删除 waitpid 调 用 。 当 fork 完 子 进 程 来 
处 理 请 求 后 ， 父 进程 关闭 新 的 文件 描述 符 并 继续 监听 新 的 连接 请 求 。 最 
后 ， 需 要 一 个 针对 于 SIGCHLD 的 信号 处 理 程序 ， 如 下 : 

void 





sigchld(int signo) 
{ 


while (waitpid((pid_t)-1, NULL, WNOHANG) > 0) 


3 


} 

16.6 为 了 允许 异步 套 接 字 WO， 需 要 使 用 F_SETOWN fcnd 命 令 建立 
套 接 字 所 有 权 ， 然 后 使 用 FIOASYNC ioctl 命令 允许 异步 信号 。 为 了 不 
允许 异步 套 接 字 “IJO， 只 要 简单 地 禁用 异步 信号 即 可 。 我 们 混合 使 用 
fentl 和 ioctl 命令 的 理由 是 ， 想 找到 最 可 移植 的 方法 。 代 码 如 图 C-23 所 
和 修 。 





finclude "apue ,hn 
finclude <errno.h> 
#include <fentl.h> 
#include <sys/socket ,h> 











include <sys/ioctl.h> 
#if defined(BSD) || defined (MACOS) || defined (SOLARIS) 





#include <sys/filio.h> 
fendif 


int 


setasync (int sockfd) 


| 


int 


int n; 


if (fentl(sockfd, F SETOWN, getpid()) < 0) 
return(-1); 

n=l; 

if (ioctl (sockfd, FIOASYNC, &n) < 0) 
return (-1); 

return (0); 


clrasync(int sockfd) 


| 


int n: 


= |): 
if (ioctl (sockfd, FIOASYNC, &n) < 0) 
return(-1); 
return (0); 
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图 C-23 允许 与 不 允许 异步 套 接 字 IO 

17.1 常规 管道 提供 了 一 个 字 节 流 接 口 。 为 了 确定 消息 边界 ， 我 们 必 
须 增 加 给 每 个 消息 增加 一 个 头 部 来 指示 长 度 。 但 这 个 仍 涉 及 两 个 额外 的 
复制 操作 : 一 个 是 写 入 至 管道 ， 另 一 个 是 从 管道 恋 出 。 更 加 有 效 的 方法 
是 仅 将 管道 用 于 告知 主线 程 有 一 个 新 消息 可 用 。 我 们 用 单个 字 节 用 作 通 
知 。 采 用 这 种 方法 ， 我 们 需要 移动 mymesg 结 构 到 threadinfo 结 构 ， 并 使 
用 一 个 互 斥 量 (mutex) 和 一 个 条 件 变 量 (condition variable) 来 防止 辅 
助 线程 在 主线 程 完成 之 前 重新 使 用 mymesg 结 构 。 解 决 方案 如 图 C-24 所 
awe 








finclude "apue.h" 
finclude <poll.h> 
include <pthread.h> 











# 
finclude <sys/msg,h> 
ł 


上 
=3 
Q 


include <sys/socket.h> 


#define NO 3 /* number of queues */ 
Hdefine MAXMSZ 512  /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct mymesg | 
long mtype; 
char mtext [MAXMSZ+1]; 


struct threadinfo qd 


int qid; 
aint Edy 
int len; 
pthread mutex _t mutex; 
pthread_cond_t ready; 
struct mymesg m; 

F7 

void * 


helper (void *arg) 
{ 
PrE n; 
struct threadinfo *tip = arg; 


EOS tssy FZ 
memset (&tip->m, 0, sizeof(struct mymsg) ) > 
if ((n = msgrev(tip->qid, &tip->m, MAXMSZ, 0, 
MSG _NOERROR)) < 0) 
err_sys("msgrcv error"); 
tip->len = n; 
pthread mutex_ lock (&tip—>mutex) ; 
if (write(tip->fd, “a", sizeof(char)) < 0) 
err sys ("write error"); 
pthread_cond_ wait (&tip->ready, &tip-—>mutex); 
pthread mutex_unlock (&tip-—>mutex) ; 


ERE 

main () 

{ 
char Cs 
nE iy Ny, Grr; 
int Ears 
int qid[NQ]; 
struct pollfd PEGINQ] 
struct threadinfo tL [NO] > 
pthread t tid[NO]; 
foe G- = 86 2 = NOF FJ 4+ 

if ((qid[i] = msgget ((KEY+i), IPC_CREAT|0666)) < 0) 


err_sys("msgget error"); 
printf ("queue ID $d is S$d\n", i, qid[il); 


if (socketpair(AF_UNIX, SOCK_DGRAM, O, fd) < 0} 
err_sys("“socketpair error"); 

ptd([i].£d — £a[oy- 

pfd[i]-events = POLLIN; 

ed Pb)... = sabe Pa 1s 

ti l[i] fa- = frL]? 

if (pthread cond init (&ti[i].ready, NULL) != 0) 
err_sys("pthread_cond_init error"); 

if (pthread_mutex_init (&ti[i]-mutex, NULL) != 0) 


err_sys("pthread mutex init error"); 
if ((err = pthread create (&tid[i], NULL, helper, 
sti[i])) != 0) 
err exit(err, "pthread_create error"); 


for (i+) { 
if (poll (pfd, NO, -1) < 0) 
err sys("poll error"); 
for (i = 0; 1 < NQ; itt) { 
if (pfd{i].revents & POLLIN) { 
lf ((n = read(pfd[i].fd, &c, sizeof(char))) < 0) 
err sys("read error"); 
ti[i] .m.mtext(ti[i].len] = 0; 
printf ("queue id $d, message %s\n", gid(i], 
ti[i].m.mtext) ; 
pthread_mutex_lock(&ti[1] mutex) ; 
pthread_cond_signal (&ti[i] ready) ; 
pthread mutex unlock (&ti[1] .mutex) ; 


exit(0); 





图 C-24 使 用 管道 的 XSI 消 息 轮 询 


17.3 声明 指定 了 标识 符 集 合 的 属性 (如 数据 类 型 ) 


。 如果 声明 也 导 


致 分 配 了 存储 单元 ， 那 么 这 就 是 定义 。 

在 头 文件 opend.h 中 ， 我 们 用 extern 存 储 类 声明 了 3 个 全 局 变量 ， 这 时 
并 没有 为 它们 分 配 存储 单元 。 在 文件 main.c 中 ， 我 们 定义 了 3 个 全 局 变 
s 我 们 也 会 在 定义 全 局 变量 时 就 初始 化 它 ， 但 通常 是 使 用 C 的 
AWE o 

17.5 select#polli E W ARIT ARE AN RRE. RA E A 
描述 符 都 处 理 完 后 ， 操 作 client 数 组 的 循环 就 可 以 终止 。 

17.6 建议 的 解决 方案 存在 的 第 一 个 问题 是 ， 在 文件 可 能 及 生变 化 的 
地 方 ， 调 用 stat 和 调用 unlink 之 间 存 在 莞 争 。 第 二 个 问题 是 ， 如 果 名 字 
是 一 个 指 问 UNIX 域 套 接 字 文件 的 符号 链接 ， 那 么 stat 会 报告 名 字 是 一 个 
套 接 字 (回想 一 下 后 面 跟 一 个 符号 链接 的 stat 函 数 ) ， 但 是 调用 unlink 
时 ， 实 际 上 我 们 古 删 除了 这 个 符号 链接 而 不 是 套 接 字 文件 。 为 了 解决 第 
二 个 问题 ， 应 该 使 用 lstat 而 不 是 stat， 但 这 解决 不 了 第 一 个 问题 。 

17.7 第 一 种 选择 是 将 两 个 文件 描述 符 在 一 个 控制 消 恩 中 的 发 送 ， 
人 的 内 存 位 置 中 。 下 面 的 代码 展示 了 这 种 方 

struct msghdr msg; 

struct cmsghdr *cmptr; 

int *ip; 

if ((cmptr = calloc(1, CMSG_LEN(2*sizeof(int)))) == NULL) 

err_sys("calloc error"); 

msg.msg_control = cmptr; 

msg.msg_controllen = CMSG_LEN(2*sizeof(int)); 

/* continue initializing msghdr... */ 

cmptr->cmsg_len = CMSG_LEN(2*sizeof(int)); 

cmptr->cmsg_level = SOL_SOCKET; 

cmptr->cmsg_type = SCM_RIGHTS; 

ip = (int *)CMSG_DATA(cmptr); 

*ipt++ = fd1; 

*ip = fd2; 

这 种 方法 在 本 书 中 涉及 的 4 个 平台 上 全 都 可 以 工作 。 第 二 种 选择 是 
将 两 个 独立 的 cmsghdr 结 构 打 包 到 一 个 消息 中 。 

struct msghdr msg; 

struct cmsghdr *cmptr; 

if ((cmptr = calloc(1, 2*CMSG_LEN(sizeof(int)))) == NULL) 

err_sys("calloc error"); 

msg.msg_control = cmptr; 





msg.msg_controllen = 2*CMSG_LEN(sizeof(int)); 

/* continue initializing msghdr... */ 

cmptr->cmsg_len = CMSG_LEN(sizeof(int)); 

cmptr->cmsg_level = SOL_SOCKET; 

cmptr->cmsg_type = SCM_RIGHTS; 

*(int *)CMSG_DATA(cmptr) = fd1; 

cmptr = CMPTR_NXTHDR(&msg, cmptr); 

cmptr->cmsg_len = CMSG_LEN(sizeof(int)); 

cmptr->cmsg_level = SOL_SOCKET; 

cmptr->cmsg_type = SCM_RIGHTS; 

*(int *)CMSG_DATA(cmptr) = fd2; 

与 第 一 种 方法 不 同 ， 这 个 方法 只 在 FreeBSD 8.0 上 能 工作 。 

第 18 章 

18.1 注意 ， 由 于 终端 是 非 规范 模式 的 ， 所 以 必须 要 用 换行 符 而 不 是 
回 车 符 终止 reset 命 令 。18.2 ” 它 为 128 个 字符 建 了 一 张 表 ， 根 据 用 户 的 要 
求 设置 最 蜗 位 (奇偶 校 验 位 )。 然 后 使 用 8 位 VO 处 理 奇偶 位 的 产生 。 

18.3 如 果 你 使 用 的 是 窗口 终端 ， 那 么 你 无 需 登录 两 次 。 在 两 个 分 开 
的 窗口 之 间 ， 你 可 以 做 这 样 的 实验 。 在 Solaris 中 ， 运 行 stty ” -a， 并 且 将 
标准 输入 重 定向 到 运行 vi 的 终端 。 结 果 显 示 Vi 设 置 MIN 为 1、TIME 为 1。 
read 调 用 会 一 直 等 待 ， 直 到 至 少 键入 一 个 字符 ， 但 是 该 字符 输入 后 ， 只 
对 后 继 的 字符 等 待 十 分 之 一 秒 即 返回 。 
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19.1 telnetd 和 rlogind 两 个 服务 器 均 以 超级 用 户 权 限 运 行 ， 所 以 它 
们 都 可 以 成 功 地 调用 chown 和 chmod。 

19.2 执行 pty -n stty -a 以 避免 伪 终 端 从 设备 的 termios 结 构 和 winsize 
结构 初始 化 。 

19.4 很 不 幸 ，fcntl 的 F_SETFL 命 令 不 允许 改变 读 写 状 态 。 

19.5 有 3 个 进程 组 : (1) 登录 shell， (2) pty 父 进程 和 子 进 程 ， 

(3) cat 进 程 。 前 两 个 进程 组 组 成 了 一 个 会 话 ， 其 中 ， 登 录 shell 为 会 话 

首 进程 。 第 二 个 会 话 仅 包含 cat 进 程 。 第 一 个 进程 组 (登录 shell〉 是 后 台 
进程 组 ， 其 他 两 个 进程 组 是 前 台 进 程 组 。 

19.6 首先 ， 当 cat 从 其 行规 程 模 块 接 收 到 文件 结束 符 时 会 终止 。 这 导 
致 PTY 从 设备 终止 ， 进 而 导致 PTY 主 设备 终止 。 接 着 ， 对 于 正 从 PTY 主 
设备 读 取 的 pty 父 进程 产生 一 个 文件 结束 符 。 该 父 进程 将 SIGTERM 信 和 号 
发 送 给 子 进程 ， 于 是 子 进程 终止 。〈 子 进程 不 捕捉 该 信号 。) 

最 后 ， 父 进程 调用 main 函数 尾 端的 exit(0)。 

图 8-29 所 示 程 序 的 相关 输出 为 : 





























cat e= 270, chars = 274, stat= 0: 
pty e= 262, chars = 40, sat= 15:F X 
pty e= 288, chars = 188, stat= 0: 
19.7 这 可 通过 使 用 shell 的 echo 命 令 和 date(1) 命 令 实现 ， 它 们 都 在 一 
个 子 shell 中 : 
#!/bin/sh 
(echo "Script started on " ‘date’; 
pty "${SHELL:-/bin/sh}"; 
echo "Script done on " date ) | tee typescript 
19.8 PTY 从 设备 上 的 行规 程 能 够 回 显 ， 所 以 pty 从 其 标准 输入 所 读 取 
的 以 及 写 同 PTY 主 设备 的 按 默认 都 回 显 。 尽 管 程序 Cttyname) 从 不 读 取 
数据 ， 但 是 该 回 显 也 可 通过 从 设备 上 的 行规 程 模块 实现 。 
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20.1 _db_dodelete 中 保守 的 加 锁 操 作 是 为 了 避免 和 db_nextrec 发 生 况 
争 条 件 。 如 果 没 有 使 用 写 锁 保护 _db_writedat 调用 ， 则 有 可 能 在 


db_nextrec 读 某 个 记录 时 ， 该 记录 已 被 删除 : db_nextrec 首先 读 入 一 个 索 
引 记 录 ， 判 定 该 记录 非 空 ， 接 痢 读 数据 记录 ， 但 是 在 它 调用 _db_readidx 
和 _db_readdat 之 间 ， 该 记录 却 可 能 被 _db dodelete 删 除了 。 

20.2 ”假定 db_nextrec 调 用 _db_ readidx， 它 将 记录 的 键 读 入 索引 缓冲 
区 。 然 后 ， 该 进程 被 内 核 调 度 进程 暂停 ， 另 一 个 进程 运行 ， 它 刚好 调用 
db_delete 删 除了 这 一 条 记录 ， 使 得 索引 文件 和 数据 记录 文件 中 对 应 部 分 
都 被 清空 。 当 第 一 个 进程 恢复 执行 并 调用 _db_readdat (7£db_nextrec ef] 
数 体 中 ) 时 ， 返 回 的 是 空 数据 记录 。db_nextrec 中 的 读 锁 使 得 读 入 索引 
记录 的 过 程 和 读 入 数据 记录 的 过 程 是 一 个 原子 操作 (对 于 其 他 操作 同一 
数据 库 的 合作 进程 而 言 ) 。 

20.3 强制 性 锁 对 其 他 的 读 进 程 和 写 进程 产生 了 影响 。 在 
_db_writeidx 和 _db_writedat 设 置 的 锁 被 解除 之 前 ， 其 他 的 读 操 作 和 写 操 
作 都 将 被 阻塞 。 

20.5 ”在 写 索 引 记录 之 前 写 数据 记录 ， 通 过 这 一 方法 来 防止 如 下 情 
We: 知 该 进程 在 两 次 写 之 间 被 杀 死 从 而 产生 不 正常 的 记录 。 如 果 进 程 先 
写 索 引 记 录 ， 而 在 写 数 据 记 录 之 前 被 杀 死 ， 那 么 号 会 得 到 一 个 有 效 的 索 
引 记 录 ， 但 它 却 指 回 一 个 无 效 的 数据 记录 。 
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21.5 这 里 有 一 些 提 示 。 有 两 个 地 方 可 以 检查 队列 中 的 作业 : 打印 守 
护 进程 的 队列 和 网 络 打印 机 的 内 部 队列 。 注 意 ， 不 要 让 一 个 用 户 可 以 取 
消 其 他 用 户 的 打印 作业 。 当 然 ， 超 级 用 户 可 以 取消 任何 作业 。 

21.7 不 需要 唤醒 守护 进程 ， 因 为 知道 需要 打印 一 个 文件 时 才 需 要 重 
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需要 重读 配置 文件 。 

21.9 需要 使 用 null 字 节 来 终止 写 到 作业 文件 的 字符 串 (strlen 在 计算 
字符 串 长 度 时 不 包含 终止 null 字 节 ) 。 有 两 种 简单 的 方法 : 要 么 对 写 入 
的 字 节 数 加 1， 要 么 使 用 dprintf 消 数 而 不 是 调用 sprintf 和 write。 
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